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Förord 

Med denna rapport vill jag beskriva ett försök med datorbaserad innehålls- 
analys, som är under utveckling inom projektet Skol pedagogiska sökstrate- 
gier (SÖK) vid lärarhögskolan i Malmö, och som finansieras av skolöver- 
styrelsen. Vetenskaplig ledare och projektledare är docent Bernhard Bier- 
schenk. Jag själv svarar för den språkmetodiska andelen inom detta projekt. 

Analystekniken, kallad ANA. CONDA, ställs här i en internationell be- 
lysning, dels vad gäller datorbearbetning av text överhuvudtaget, dels och 
främst vad gäller teorier, lingvistiska och psykologiska, som är aktuella 
för oss. Efter att våra första försök med denna teknik har utprövats och 
redovisats, har det känts viktigt att förankra tekniken i sitt ämnes specifika 
och metodiska sammanhang och att visa på vilka punkter den kan jämföras 
med och hävda sig bland andra liknande försök. Det bör dock poängteras 
att vår metod för datorbaserad innehållsanalys har att passera flera sta- 
dier innan den kan betraktas som färdig. Men det är min förhoppning att 
den genom denna rapport har fått fastare ramar och en solidare grund än 
hittills att stå på inför de återstående utvecklingsfaserna. 



Malmö, december, 1975 



Inger Bierschenk 



1. OM BRUKET AV TERMER 

Denna rapport presenterar och diskuterar några modeller och teorier från 
såväl språk- som samhällsvetenskapliga forskningsområden. Den termino- 
logi som utvecklats inom de olika forskningsgrenarna kan ibland försvåra 
förståelsen,när teorier sätts i relation till varandra. Ofta benämns feno- 
men olika, även om det rör sig om samma sak. Det kan också vara så, att 
begrepp definieras lika men används på olika sätt. Dessutom finns det ter- 
mer som överlappar mellan teorierna. Ett par terminologiska problem 
skall exemplifieras. 

I kapitel 5 används termen "conceptualization", som ibland översatts 
med ett försvenskat "conceptualisering", som egentligen inte säger mer 
än den engelska termen. Där det har känts nödvändigt har begreppet över- 
satts med "sats", som till stor del täcker vad författaren har avsett och 
som är enklare att förstå, när det sätts i samband med en syntaktisk struk- 
tur. 

I kapitel 6 används termen "tema" på ett helt annat sätt än vad denna 
term avser i de första kapitlen. Där termen nämns i kapitel 3-5 betyder 
den övergripande satstema eller modifiering, som tillhör en syntaktisk- 
semantisk språkanalys. I kapitel 6 betyder tema ungefär värderings struk- 
tur och tillhör en kognitionspsykologisk analys ("discourse model"). 

När man vill jämföra olika teorier med varandra, skulle man vilja ha 
en enhetlig terminologi, som väsentligt skulle underlätta jämförelsen. 
Men det skulle inte vara rättvist mot respektive författare eller mot teo- 
rin om man försökte anpassa termer och begrepp för ett speciellt syfte. 
Jag har därför valt att presentera modeller och teorier i de termer som 
används av deras upphovsmän och hoppas att texten ger det nödvändiga 
sammanhanget, så att läsaren inte känner mångfalden av de använda ter- 
merna alltför betungande för förståelsen. Däremot är det möjligt att de 
flesta läsare av den här skriften inte känner sig förtrogna med termer som 
är allmänt brukliga i språkvetenskapliga texter. För dessa läsare har jag 
sammanställt en förteckning över sådana termer med förklaringar i bilaga. 
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2. DATORBASERAD INNEHÅLLSANALYS: EN KORTFATTAD ÖVER- 
BLICK 



I den samhällsvetenskapliga forskningen används i stor utsträckning inne- 
hållsanalys när man vill ha information ur verbala data, t ex intervjusvar, 
politiska tal eller tidningstexter. Det finns emellertid ingen innehållsana- 
lysmetod som gäller generellt för allt verbalt material. Eftersom forskare 
inom olika discipliner sedan länge har varit bundna till manuella analyser, 
har det utvecklats lika många innehållsanalystekniker som det funnits fors- 
kare som använt innehållsanalysmetoder. Först nu tycks utvecklingen ha 
kommit så långt att denna metod kan bli mera enhetlig och därför mera ge- 
nerell i och med att datorer kan användas. 

Utvecklingen av en datorbaserad innehållsanalysmetod som lämpar sig 
för varierande syften inom de beteendevetenskapliga ämnena är i hög grad 
önskvärd. Den beteendevetenskapliga forskningen styrs vid informations- 
insamlingen i alltför stor utsträckning av formali serade frågeformulär. De 
data som på så sätt insamlats är relativt lätta att hantera jämfört med ver- 
baliserade svar, men metoden innebär i många fall att risken för ofullstän- 
dig information är stor. De forskare som inte vill ta sådana risker och där- 
för tillåter öppna svar står genast inför problemet att bearbeta text, dvs 
att analysera data med i princip obegränsade tolkningsmöjligheter. Ett väl- 
känt faktum är också att en manuell bearbetning av text är mycket tids- 
ödande och arbetskrävande, eftersom den information man är ute efter säl- 
lan finns väl samlad. Vid organisering och strukturering av sådan informa- 
tion torde datorn utgöra ett viktigt hjälpmedel. £n datorbaserad innehålls- 
analys är nästan oundviklig i de fall där forskare önskar utföra sofistikerade 
analyser och där de vill pröva olika teorier och modeller på samma grund- 
material utan att för den skull behöva manuellt bygga om komplexa kate- 
gorisystem och omkoda stora mängder av informationsenheter. I ett för- 
ord till "The General Inquirer" skriver sålunda Lasswell (Stone et al. , 
1966): 

"The essential problem of content analysis is to provide a procedur e that 
preserves and codes as economically as possible the meanings relevant 
to social theories. The scientist who works with samples of data with which 
he is concerned can nowhope eventually to identify the universe of refe- 
rents pertinent to his theory. " 

2. 1 Ett system för textanalys: "The General Inquirer" 

Det välkända innehållsanalyssystem som går under namnet "The General 
Inquirer" (GI) är en samling datorprogram, som utvecklats av P. J. Stone 
vid Harvard University för att användas vid innehållsanalys av naturligt 
språk. Stone (1966, s 5) definierar innehållsanalys som: 
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"any technique for making inferences by objectively and systematically 
identifying specific characteristics within text. " 

"Specificerade karakteristika" kan vara en lista på ord eller fraser, som 
identifieras och räknas, kategorier som bildas på lingvistisk grund, uti- 
från samhällsvetenskapliga teorier , etc. 

GI presenterades for första gången 1962 (Harvard- versionen) och har 
sedan dess förändrats och förbättrats åtskilliga gånger innan den 1974 pre- 
senterades som färdig. De program som nu föreligger är till stor del ett 
verk av forskare i Edinburgh. 

Edinburgh -version en är i första hand en implementering av den s k 
Inquirer III Content Analysis på IBM 370/155. Det programspråk som an- 
vänts vid Harvard är PL/l (utvecklat av Spence), vilket inte tidigare an- 
vänts i England. För det andra har man koncentrerat sig på de syntaktiska 
och semantiska aspekterna i Harvard IV Psycho- Sociologi cal Dictionary, 
som är det huvudsakliga lexikonet vid innehållsanalyser baserade på GI 
(Coxon & Chalmers, 1974, ss 53-54). 

GI är ett lexikonbas erat innehållsanalyssystem. Ett lexikon (dictionary) 
innehåller semantiska kategorier som i förväg be stämts enligt någon sam- 
hällsvetenskaplig teori. Flera lexikon har utvecklats för att ta hänsyn till 
olika discipliners eller problemområdens karakteristika, t ex "The Har- 
vard Third Psychological Dictionary", "Need Achievement Dictionary" 
och "Psycho- Sociologi cal Dictionary". 

I en översikt över Inquirer -systemet (Trappes-Lomax, 1974, s 1) ges 
systemets kapacitet i följande tre punkter: 

1. fysisk igenkänning av items i text; 

2. igenkänning av sådana items såsom "fall" (tokens) av en specificerad 
lista av ord- och interpunktionstyper; 

3. tilldelning av sådana items till en eller flera kategorier i ett i förväg 
specificerat kategorisystem. 

Den första av dessa funktioner innebär ett särskiljande av ord, datum, 
siffror, penningsummor, vanliga förkortningar och inte rpunktio ner (inklu- 
sive början och slut av meningar). Den andra innebär förmåga att urskilja 
vanliga homografer, vilket innefattar en undersökning av ordet i fråga i 
relation till omgivande text, interpunktion, suffixbildning och den breda 
klassificeringen av orden i dess omedelbara närhet. (Det skall alltså gå 
att komma fram till om ordet t ex är ett verb eller ett substantiv. ) Där- 
efter bestäms en av flera möjliga betydelser ("senses"). Den tredje in- 
kluderar räkning av alla items ("tag tally procedure") för varje kategori 
och alla meningar som innehåller en viss kategori. De karakteristika i 
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texten som Stone nämner och. som en analys baseras på är värdet ("value") 
av enskilda text items i relation till något kategorisystem i ett lexikon. 

GI opererar på hel text, t ex ett helt dokument, vilket framgår av 
punkterna 1-2 ovan, men analysenheten är det enskilda ordet. Efter att 
datorn har känt igen alla ord i en text, skriver den ut en lista ("out-put filé") 
med ord och kategoritillhörighet tillsammans med ett värde (t ex värdet 
från en Osgood-skala multiplicerat med frekvens i texten). Denna lista är 
en representation av data. Men en representation av data blir först av be- 
tydelse när den kan sättas i relation till en teori. Problemet för informa- 
tionssökaren eller användaren av systemet är hur tolkningen av denna re- 
presentation skall ske. Användaren måste själv ha en hypotes om vilka spe- 
cifika items eller kopplingar av items som är relevanta i hans fall. I hans 
teori kan t ex ett ords tillhörighet till en kategori vara irrelevant. Det är 
ofta i tolkningsskedet som användaren finner att ett lexikon är för stelt för 
att vara till nytta. 

En av Edinburgh-versionens huvudsakliga förbättringar av GI är ut- 
vecklingen av en procedur som markerar alla tvetydiga ord i en text och • 
skriver ut dem med identifikationsuppgifter, så att användaren själv kan 
bestämma vilken kategori som i det speciella fallet är lämpligast. Denna 
"New Tagger-version" presenterades 1974. Omförbättringen skriver 
Trappes-Lomax (19 74, s 4): 

"Standardisation and isolation of the disambiguation operation allows the 
user to concentrate on modifying, as he pleases, andusing more selectively, 
the content dictionary. " 

Den nya identifikations rutinen tycks vara tillkommen efter erfarenheter av 
att användare nästan aldrig har teorier och hypoteser, som är så standardi- 
serade att ett a priori- konstruerat lexikon helt passar. Visserligen är GI 
välkänt och mycket använt,men metoder och tekniker förändras, likaså 
forskningsproblem. GI är en föregångare inom datorbaserad innehållsana- 
lys och berörda forskare har bidragit med omistliga insatser inom program- 
utvecklingen. Det är dock tveksamt om de lexikon man inom ramen för 
detta system har byggt upp kan bestå, eftersom de 7 trots förbättringarna 
av forskarteamet i Edinburgh, i ringa grad tillåter nya teorier inom de 
samhällsvetenskapliga ämnena. En allvarlig anmärkning mot dem dess- 
utom är att de är konstruktioner utan empiriskt underlag. Forskare som 
har erfarenheter av GI har vid ett internationellt forum diskuterat detta 
och andra system. Denna konferens, som redogörs för i det följande, har 
visat hur beroende ett innehållsanalys system är avarten av problem och hur 
olikartat forskare världen över behandlar sina data. För SÖK- projektets 
del har det varit väsentligt att ta del av dessa erfarenheter och jämföra 
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våra och andras framsteg. Vår analysteknik kommer därför att presenteras 
längre fram i rapporten i jämförande syfte. Som grund för jämförelsen pre- 
senteras först några aktuella forskningsområden och analysproblem, så- 
som de framförts i en preliminär konferensrapport (ISSC-CISS, 1974). 

2« 2 Några problemområden inom datorbaserad innehållsanalys: Summering 
av en internationell workshop 

Datorbaserad innehållsanalys börjar bli mer och mer använt och användbart 
internationellt. Kravet på program och tekniker anpassade för olika pro- 
blemområden gör sig mer och mer gällande, vilket en workshop on "con- 
tent analysis in the' social sciences", hållen i Pisa i september 1974 har 
vittnat om. Denna workshop har genom sina i förväg publicerade papers 
(ISSC-CISS, 1974) givit en god överblick över var särskilt europeisk forsk- 
ning står idag när det gäller datortekniker vid innehållsanalys. Det har 
känts särskilt värdefullt för SÖK-projektet att ta del av dessa papers, ef- 
tersom de flesta av dem innehåller redogörelser och funderingar kring 
mindre försök som fortfarande är på utvecklingsstadiet. 

Redogörelsen nedan sker med reservation för ny information som kan 
komma att ges i en kommande bok om wörkshopen, redigerad av S. Draghi 
någon gång under hösten 1975. SÖK-projektet är representerat i papersam- 
lingen (B. Bierschenk, 1974 a) men refereras inte här, utan mer detaljerat 
längre fram. De flesta bidragen är mycket knapphändiga. Framför allt 
skall nämnas att de sällan redogör för kodning av text eller statistisk be- 
handling. Detta beror möjligen på att respektive författare haft för avsikt 
att vänta med en sådan presentation till själva konferensdagarna eller ock- 
så har undersökningen eller projektet inte kommit så långt att det varit 
möjligt. 

Konferensen i Pisa anordnades i samband med att Edinburgh-versionen 
av GI förelåg färdig. Avsikten var (1) att presentera den nya versionen och 
låta konferensdeltagarna utföra analyser med hjälp av detta system på egna 
data, (2) att få en samlad bild av vilka analysproblem som finns inom de 
samhällsvetenskapliga disciplinerna i olika länder, (3) att få belyst på vil- 
ken metodisk nivå de presenterade forskningsprojekten befinner sig (steg 
inom systemutvecklingen) samt (4) att försöka utforma generella riktlinjer 
(konventioner) för datorbaserade system, så att de får så stor räckvidd 
som möjligt, bl a att de kan implementeras på olika typer av maskiner. 

Presentationen följer i möjligaste mån punkterna 2 och 3, Punkt 4 be- 
handlas under egen rubrik. 
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Inom det politiska området (' political science") tycks ett stort intresse 
finnas för undersökningar där datorer kan användas vid analyser. Deichse! 
från Hamburg rapporterar om ett projekt som använder tidningsrubriker för 
att undersöka politikers image före och efter regimskiftet Brandt-Scheel 
1969. Tidningsrubriker antas återspegla "political verbal interaction", 
Deichsel (1974, s 73) vill utveckla ett instrument för observation av den 
sociala strukturen av "symbol- worlds (headlines) ". Genom att göra ett ur- 
val av olika slag av nyhetsorgan hoppas man kunna påvisa t ex vilken image 
politikerna får genom det sätt på vilket de i rubrikerna presenteras för lä- 
sarna. 

Kodning och statistisk behandling av data framgår inte. 

Vid Hamburgs universitet har man utvecklat EVA- systemet , baserat 
på GI. (EVA - Electronic Verbal Analysis, ) Hoizschenk (1974, s 288) 
redogör kortfattat för EVA-systemets kapacitet: 

1. producerar listor med ordfrekvenser (med referens till text) 

2. kontext-fri kodning av text på basis av ordform, utan ändelsereduktion 

3. varje enhet ("tag") kan återföras till kontext ("tag-based retrieval") 

Syftet med Holzschencks analys (Action Analysis) är att undersöka beroen- 
den mellan den handlande och handlingen i tidningsrubriker. Tyska poli- 
tiska partier är de handlande ("actors") och objekt för handlingar ("objects 
of action"). 

Ett lexikon har byggts upp, kallat SE MANTAX, som innehåller begrepp 
(concepts) av första eller andra graden, således huvud- och underavdel- 
ningar, av vilka de senare används efter en validering genom textsökning. 
Dessutom finns syntaktiska markeringar. 

Typen av analys beskrivs på följande sätt (Holzschenck. 1974, s 289): 

1. kodning av text i sekvenser 

2. "tag"-baserad kontextsökning 

3. syntaktisk/semantisk rekonstruktion av meningar 

Dataanalysen innebär bildandet av frekvensordlista av ord eller begrepp 
("tags") i definierade syntaktiska positioner. De resultat man väntar sig 
att finna är en struktur i politiska partiers handlingar som "actors" och 
"objects of action". 

Andra europeiska forskare med politiskt intresse är Susan Garbett i 
London, Karen Siune i Aarhus och Ulf Himmelstrand i Uppsala. Garbett 
vill undersöka interaktionen mellan politikerna i parlamentet och mass- 
media, framför allt TV. Problemställningenär: Vill parlamentet vara 
med om att spelas in under sessionerna? Undersökningsmetod tycks inte 
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vara fa*, ställd, inte heller innehåll analysteknikens art. Lika vag i detta 
avseende är Siunes framställning. Hon är intresserad av valkampanjen 
1971 och hur kommunikationen mellan partierna och väljarna sker via ra lio 
och TV. Den teori som ligger bakom är frågan om huruvida valpropaganda 
är "plattformar" för politikerna eller "fönster" för väljarna. Siune presen- 
terar siffror för olika variabler, som t ex art av framträdande (utfrågning 
i TV, debatt-tal) eller slaget av ämnesval (ekonomi, familjepolitik). Till 
vad dessa variabler skall användas tycks inte vara klarlagt ännu, vilket 
också medför att man inte får någon anvisning om hur en analys via dator 
skall kunna ske. 

Himmelstrand, tillsammans med bl a K-E Rosengren i Lund, tycks ha 
kommit mycket längre. Detta forskarteam intresserar sig för hur kriget 
i Nigeria kommunicerats i internationell press. Problemställningen är inte 
så olik forskarnas i Hamburg. Politisk "actor" eller "event" står i förgrun- 
den. Problemställningen är av komplex natur och syns i detta paper vara 
väl underbyggd. Sammanfattningsvis kan man kalla undersökningen en stu- 
die i relationerna mellan samhälls- och organisationsstruktur och dessa 
strukturers manifester ing i massmedia. Syftet är att undersöka om bak- 
grundsinformation av strukturell natur (t ex karakteristika hos en politisk 
"actor" eller "event") korrelerar med tidigare använda moraliska omdö- 
men i politiska kommentarer till rapporterade händelser. Hypotesen är att 
starka moraliska omdömen uppträder även där det finns rik kontextuell in- 
formation av strukturell natur i rapporteringen, men att sådana värderande 
omdömen uttrycks på ett senare stadium, eller om de uttryckts tidigare, 
är omgivna av reservationer (Himmelstrand et al. , 1974, s 42). Många 
variabler är av intresse i denna omfattande studie, t ex afrikanska nyhets- 
organs interna struktur, nyhetsförmedlingen inom Afrika, mm. 

Undersökningar i form av pilotstudier rapporteras ha företagits. Ett 
omfattande kodat material finns. Men på vilket sätt det skall datorbearbe- 
tas framgår tyvärr inte. 

Inte enbart massmedia är objekt för politiska studier. Vid universite- 
tet i Giessen har Mohler försökt lägga upp en undersökning av "indivi- 
duell och kollektiv makt". Stoffet hämtar han ur tyska pojkars examens- 
uppsatser från 1917-1971. Mohler (1974, s 300) säger: 

"My problem is to extract political images and to show their change över 
time. " 

Om ima ge -struktur en förändrats genom tiden förväntar författaren att det 

återspeglas i antalet klassificerade teman ('emotion" 'action/' m fl). Han 

efterlyser dock ett medel att återvinna teman i en text, eftersom en "one- 

man- analysis" som denna skulle vara mycket tidsödande. Ett "general 

dictionary" vore önskvärt. 
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Namenwirth (Connecticut) har studerat förändringar i amerikanska 
värderingsmönster (American Party Platforms). Det har funnits olika 
slag av värderingar under det sista århundradet, t ex expressiva, adaptiva, 
instrumenten a, osv. På vad sätt värdeförändring sker mäts med kluster- 
analyser. Slutsatsen är att ju större konflikter ett samhälle har, desto 
större "value intensity" finns det (Namenwirth, 1974, s 168). 

I beteendeveten skapligt sammanhang finns det också ett stort intresse 
att genom analys av naturligt språk via datorbearbetningar komma åt en 
struktur eller mening. 

Vid universitetet i Ulm undersöker en grupp (Kächele et al. , 1974, 
ss 100-110) förändringar i innehållet i tal under psykoanalytisk behandling. 
Variablei-na är substantiv, som tilldelas semantiska kategorier. Genom 
statistisk analys (korrelationsstudier) får man fram vilka begrepp som 
väcker eller uttrycker negativa resp positiva känslor hos patienterna. Kli- 
niska variabler, t ex ångestneuros , kan således definieras medhjälp av- 
verbalt innehåll, vilket konfirmerar de antaganden man har i psykoanaly- 
tisk teori om neuroser. Egna program och lexikon har inte byggts upp. 
utan man använder sig av GI. 

Vid Zentralarchiv fur Empirische Sozialforschung, universitetet 
i Köln, är Köps intresserad av äktenskapsannonser. Han vill studera 
dem ur en vad han kallar "Who-am-I" -vinkel. Annonserna beskriver den 
egna personen och vilka egenskaper man förväntar sig hos den sökta par- 
ten. En annons som enhet är alltså en self-other-beskrivning. Genom att 
välja tidningar som man vet läses av olika socialgrupper (Die Zeit - Heim 
und Welt) förväntar Köps sig att: finna skillnader i socialgruppernas nor- 
mer och värderingar. Undersökningen har inte kommit så långt, då man 
fortfarande (1974) har problem med kodning och stansning. Däremot har 
Köps tillgång till ett väl utvecklat datoranalysprogram i Köln, som kallas 
TEXTPACK och har utvecklats vid denna institution. 

Tiemann (Freie Universität, Berlin) anmäler problem med lexikon- 
konstruktion angående "Ingroup-Outgroup-Analysis' 1 . Han diskuterar pro- 
blem med att skapa kategorier som inte överlappar, vilket GI- systemet 
gör. Han har just de analysproblem som nämndes i samband med 
Edinburgh- versionens förbättring för användaren (se sid 6). 

Transgaard från Köpenhamns socialfor skningsinstitut är intresserad 
av teorier och modeller för attitydstrukturer och vilka metoder man bör 
använda för att komma åt attityder , samt hur kodning och analys kan ske, 
framför allt när intervjuer används som undersökningsteknik (Transgaard, 
1974, s 308). 

Av mer antropologisk natur är Marandas studier av myter. Hypotesen 
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är att myter, som semantiska system, bildar semantiska kartor med en 

probabilistisk struktur och att de kan beskrivas genom användning av auto- 

mata -teorin. Maranda & Maranda (1974, s 138) säger: 

". . . human communication is a social contract which rests on subliminal 
laws, and / .,y a culture's myths contain its semantic jurisprudence. " 

Denna studie kan inordnas bland sådana som försöker analysera seman- 
tiska nätverk. 

Samma författare har också studerat r olikar aktäristik ur Racines verk 
Andromaque (Maranda, 1974, ss 110-123). Undersökningen gäller spelet 
mellan personerna och förhållandet mellan dem samt sannolikheten för att 
den ena personens utspel följs av replik från en viss annan. Det finns dess- 
utom ett samband mellan handlingsfortskridande och rollens klasstillhörig- 
het. Han får fram ett handlings schema eller nätverk som visar att huvud- 
karaktärerna bygger upp handling. 

Information och dokumentation är ett specialområde som utvecklas mer 
och mer. Även här tycks Köln ha en framskjuten plats. Mochman (1974, 
s 286) presenterar Z.A.R. -systemet, som lagrar och återvinner data. 
I stället för indexering finns det utvecklat ett "retrieval dictionary". Syste- 
met möjliggör återvinnande av samtidigt förekommande och automatiskt 
särskiljande av relevanta termer och har rutiner för morfologisk analys. 
Mochman (1974, s 298) anmäler systemet på följande sätt: 

"Compared to Content Analysis, which has been defined a technique for 
making inferences, Information Retrieval can be labelled a technique for 
making references. " 

Programmet RIQS (Remote Information Query System) har utvecklats 
och förbättras fortgående av Northwestern Uhiversity in USA. Systemet är 
i första hand tänkt att användas på bibliotek och handhar bibliografi ska 
data. (Används bl a i Amsterdam. ) 

De program för viss innehållsbearbetning av text som hittills nämnts 
i pap er- samlingen tiL Pis a- konferens en ger ingen presentation av hur 
programmen används. Ett bidrag som endast har till syfte att detaljerat 
ge sådana instruktioner är utarbetat av Spence (Research Center for Men- 
tal Health, New York University). Programmens kapacitet redovisas och 
förutsättningar för kategoriers uppbyggnad på hålkort ges. Spence visar 
programmen DICT, LIST.. HUNT, SEARCH och SORT. Hela paketet kallas 
PL./1 , som är programspråket för WORDS- och Inquirer- systemen. 

Mindre känt är kanske det norska bidraget till datorbaserad innehålls- 
analys. Fonnes presenterar TEXT, "a general program package for text 
proc ess ing". Programmet har utvecklats för att underlätta återvinning av 
speciella items i stora textmängder. Det mest positiva med TEXT är att 
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det inte kräver ingående kunskaper i programmering, utan kan användas av 
humanister efter en kort introduktion (Fonnes, 1974, s 78), Fonnes nämner 
dock att TEXT inte i första hand var avsett för innehållsanalys, men att en 
utveckling av paketet pågår vid universitetet i Oslo. 

De redovisade projekten och undersökningarna är endast en liten del 
av vad som pågår inom området datorbaserad innehållsanalys. Den mycket 
omfattande amerikanska satsningen är i synnerligen liten utsträckning re- 
presenterad här. Det är dock i USA som pionjärinsatserna har skett. Men 
även i Europa satsas det på datoranalyser. Ledande land här är otvivelaktigt 
Västtyskland. Framför allt Köln och Hamburg har utvecklat gedigna pro- 
grampaket. 

Av de redovisade bidragen att döma tycks de flesta försöken beröra so- 
ciologiska undersökningsfält. En förklaring till just denna typ av bidrag till 
konferensen kan vara att P. Stone själv är sociolog, och att informationen 
om denna konferens huvudsakligen nått universitetens sociologiska institu- 
tioner. Intresset för denna teknik inom de samhällsvetenskapliga ämnena 
får ändå anses väl dokumenterat genom bidragen till den internationella 
konferensen i Pisa. Stone (1975 a, ss 110-111) säger: 

"It is no longer a matter of a few pioneer systems only available at extreme- 
ly large computation centers in extreme ly advanced countries. " 

men tillägger också att: 

". . . Pisa also made it evident that many problems remain to be solved, " 
Som en summering av konferensens erfarenheter beslöt man att utarbeta 
några konventioner och rekommendationer, som i fortsättningen borde föl- 
jas av utvecklare och användare av datorer i samband med innehållsanalys. 
Dessa s k "Pisa conventions" redovisas nedan och följer Stones framställ- 
ning (Stone, 1975 b, ss 127-137). 

2. 3 Konventioner för textbehandling 

Stone konstaterade efter konferensen bl a (Stone, 1975 a, s 107) att 
"Content analysis researchers are not coordinated at all. " 
Innehållsanalysforskning bedrivs på ett dussintal språk och med stor va- 
riation ifråga om strategier. De program och erfarenheter samt även 
nyare frågeställningar och problem som konferensen samlade blev en ut- 
märkt grund för generella diskussioner. 

Den kanske viktigaste frågan att diskutera vid innehållsanalyser gäller 
analysenhet ("unit"). Vanligen är det det enskilda ordet som används i 
dessa analyser, eftersom det är lämpligast för olika slag av statistiska 
bearbetningar. Men ordet bör inte vara skilt från kontexten. Meningen 
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("sentence") är en lämplig enhet vid tema-analys (t ex förmodan). Dess- 
utom kan det vara så att en ordsträng, dvs en räcka av ord. är en me - 
ningsenhet ("content"), t ex vid idiom. 

Konvention 1. Analysenhet är det enskilda ordet. Varje enhet eller "tag !! 
bör innehålla information som identifierar ordet till visst dokument, stycke, 
mening och meningsposition. När man arbetar med hel text som input är 
det också viktigt, att man kodar interpunktionen. Detta möjliggör att man 
kan analysera teman i ett textavsnitt. Motiveringen för att ta ordet som 
bas är att olika slag av ordlistor, alfabetiska eller f rekvensbyggda . är enk- 
lare att skapa än sådana som bygger på syntaktisk struktur. 

Konvention 2 . "Common derived text formats". Standardisering för hur 
text skall matas in i dator är nödvändigt. Om data skall stansas skall det 
vara i form av versaler med numerisk information i början eller slutet av 
kortet. Betydelsen av parenteser kan variera beroende på vilket format 
som används. Men i stället för att fixera ett format vore det värdefullt att 
tillåta flera slag av inmatningar, som sedan kan konverteras till ett stan- 
dardformat. 

Konvention 3. Information om identifikation. Beroende på text eller infor- 
mationstyp bör det finnas plats för kodning av identifikationstyper som är 
relevanta i det speciella fallet. I en intervju t ex kan man vara intresserad 
av distinktionen mellan fråga och svar. Ett fält för sådan identifiering bör 
kunna variera i längd. Varje analysenhet innehåller således information 
som är textbaserad (syntaktisk eller semantisk kodning) och/eller icke 
textbaserad (identifikation). 

Förutom att man enades om dessa tre konventioner beslöt man också att 
rekommendera ("Pisa recommendations") följande: 

1 . separering av typ och fall ( "type- token") i lexikon och 

2 anpassning av lexikonsöknings strategier till respektive språk 

Den första punkten tar upp frågan om hur varje fall ("token") av ett ord 
skall representeras i ett register. Varje ord skall följas av deskriptorer 
(som här betyder kategoritillhörighet och värde) och det bör räcka med 
ordtyp. När detta ord uppträder flera gånger i texten skall samma deskrip- 
torer inte behöva upprepas. 

Det kan emellertid uppstå problem med att definiera vad som är ett 
fall av samma ord, dvs man glider in på innehållet i varje ord, ifall det 
uppträder i olika syntaktiska positioner. Har ordet då en ny betydelse 
som skall registreras som särskild typ? Stone själv kommenterar detta 
(Stone, 1975 b, s 133): 
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"If so, then the type filé is not stable, but in fact acquires xnore records as 
the processing continues and new distinctions are added. " 

Den andra punkten tar upp problem med ändelser. Om den s k "dictio- 
nary lookup"- rutinen sorterar ord alfabetiskt och sedan jämför orden med 
ett lexikon, uppstår besvär med alla böjningsformer om dessa inte finns i 
lexikonet. Stone refererar till systemet WORDS som har ett lexikon med 
ett stort antal böjningsformer. För varje ordböjning finns en rotform som 
ersätter den böjda formen. Oregelbundna former ersätts med regelbundna. 
Men detta system kan inte användas på t ex ett språk som tyskan, som har 
mångdubbelt fler ändelser än engelskan. Slutsatsen är att ett lexikon upp- 
byggt med alla böjda ordformer blir onödigt stort och ohanterligt. Inquirer- 
systemet har en s k "hash Ii st" -sökning. Den innebär att datorn söker på 
ordlängd. När hela ordet har hittats tas ändeisen bort. Denna procedur fun- 
gerar när suffixen är kända och finns listade i ett särskilt andel ser egister. 

Ett annat exempel på olikheter mellan språk är ord samman sättningar. 
Om sammansättningsleden skall betraktas som ett ord var för sig, skulle 
i tyskan t ex suffixlistan bli oändlig och således oanvändbar. Stone tar 
exemplet "Sozialforschung". Det enda sätt på vilket en procedur som ovan 
nämnts skulle kunna komma fram till ordet "Sozial", vore att betrakta 
"Forschung" som en ändelse. Anledningen till denna diskussion är att lik- 
nande sammansättningar inte finns på engelska, där orden är delade, "so- 
cial research". 

Pisa-konferensen har visat att hur väl utvecklade datorprogrammen 
än tycks vara, så lämpar de sig inte för alla språk. Innehållsanalysfors- 
kare måste därför anpassa sin programutveckling till det egna språkets 
karaktär. Ett system på svenska kan således utnyttja vissa principer i 
redan existerande system, men detaljerna måste utarbetas beroende på 
det svenska språkets uppbyggnad, och det är både tids- och kostnadskrä- 
vande. Detta faktum kan man inte gå förbi och det ensamt räcker till för 
att förklara varför "content analysis researchers are not coordinated at all". 
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3. ANACONDA OCH PISA - KONVENTIONERNA 



SÖK- projektets metodutveckling för en datorbaserad innehållsanalys (Ana- 
lysis of con cepts by data processing, ANACONDA) har nu pågått i två år. 
Bakgrunden till projektet, där denna del ingår, har redovisats i flera tidi- 
gare sammanhang. Projektets uppbyggnad och innehåll har presenterats av 
B. Bierschenk (1974 b). Här lämnas ändå några upplysningar som kan vara 
av vikt för en jämförelse med andra liknande försök. 

Vårt problemområde faller närmast inom disciplinen psykologi och rör 
"forskning om forskning". Forskare på beteendevetenskapliga institutioner 
i Sverige har intervjuats om sin forskningssituation, idéer till forsknings- 
problem, strategier och tekniker vid genomförandet av forskningsuppgifter 
samt sättet att samla information om problemområdet ifråga. Datainsam- 
lingen har skett via intervjuer med såväl bundna som öppna svarsalternativ. 
Vårt försök med datorbaserad innehållsanalys har till uppgift att strukture- 
ra de öppna svaren, som vid intervjutillfället togs upp på ljudband. Våra 
försök med bearbetning av text har gjorts på ca 10% av detta material, som 
totalt omfattar nära 4000 sidor text. Det frågeområde som kommit att be- 
handlas i detta skede gäller information och dokumentation, som betrakta- 
des som tillräckligt konkret för prövningen av metodutvecklingens olika fa- 
ser. 

Syftet med vår typ av innehållsanalys är att försöka få fram en sådan 
struktur i intervjupersonernas yttranden som återspeglar vem (agenter el- 
ler "actors") som agerar (planer och strategier) mot vem eller vad (objekt 
eller mål). Paradigmet förkortas A a O. För en innehållsbestämning av de 
enskilda items eller textkarakteristika använder vi Osgoods teknik för ska- 
lering av adjektiv och verb i de tre dimensionerna positiv- negativ, aktiv- 
passiv och stark- svag. De värden vi där får fram används för en kvantifie- 
ring av "attitydobjekt". Vi avser bygga upp strukturerade register av be- 
grepp på basis av bl a klusteranalyser och på så sätt undvika att i förväg 
bestämma kategorier (jfr GI). 

Syftet med följande presentation är att belysa likheter och olikheter 
mellan ANACONDA och GI, eftersom den senare ligger till grund för många 
andra analysförsök, vilket också Pisa -konferensen har visat. 

De konventioner som Pisa- konferensen utmynnade i är viktiga spörs- 
mål för alla som arbetar med datoranalyser för att hela området skall 
kunna stabiliseras och för att utbytet mellan de olika forskarna skall bli 
mera fruktbart. Däremot har rekommendationerna inte tillkommit för att 
slaviskt följas, utan för att vara underlättande för kommunikationerna 
mellan programutvecklarna och innehållsanalysforskarna. I vad mån fors- 
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kärna anammar en rekommendation är beroende av vilken typ av informa- 
tion varje analys är tänkt att ge. Det vi i det här fallet är intresserade av 
är i hur stor utsträckning vi följer konventionerna, framför allt med tanke 
på att våra försök med inmatning och identifikation startade före konferen- 
sen. För oss är det därför viktigt att veta att vi inte ligger för långt ifrån 
dessa allmänna riktlinjer när vi vill föra ut systemet i internationellt sam- 
manhang. 

Framställningen nedan skall följa Pisa -konventionernas punkter och 
där det är nödvändigt dras en parallell till GL 



3. 1 Analys enhet 

En väsentlig och grundläggande skillnad mellan vår analys och de flesta 
andra är att vi baserar vårt kodsystem på talad text. GI använder skrivna 
dokument av olika slag. I vårt fall måste den talade texten först prepareras 
innan vidare hantering kan ske, eftersom den är nedskriven från ljudband 
i så "autentiskt" skick som möjligt. Det går alltså inte att låta stansa denna 
text i det skick den befinner sig på bandet. Först måste en rensning ske, 
så att den går att urskilja i meningar och satser, vilket medför att det 
måste finnas regler för kodare att först åstadkomma denna rensning och 
urskiljning (se I. Bierschenk, 1974, s 50). För att illustrera hur vårt 
autentiska material kan se ut ges i ruta 1 ett textavsnitt med samma text 
i preparerat skick. 

Vår analysenhet är meningen ("sentence") och inte det enskilda ordet. 
Varje mening analyseras för sig i satser och de där ingående delarna, dvs 
b egrepp , som kodas enligt funktion i satsen. Input är således begrepp, som 
kan vara ett enda eller flera ord. Om man stansar in hel text utan före- 
gående segmentering återstår ett omfattande arbete med automatisk igen- 
känning av en texts olika delar, som vi inte har haft för avsikt att försöka 
utveckla, dels därför att sådana försök har gjorts till en vetenskap för sig 
och dels för att problemen syns oöverstigliga när det gäller de semantiska 
aspekterna på textförståelse. Visserligen tar kodningen av texten i vårt 
fall lång tid i anspråk, men när den väl är genomförd har vi ett analysin- 
strument med många fler möjligheter än många andra, som inte kan åstad- 
komma så mycket mer med sitt material än att lista ord. Och den möjlig- 
heten går ju inte förlorad för oss ändå, 

. Stone anförde i avsnittet om den första Pisa- konventionen att möjlig- 
heterna att analysera teman i en text finns om man kodar meningars bör- 
jan och slut, på så sätt att interpunktion ste eken har särskild kod. Det är 
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antagligen det enda tänkbara sättet vid det slaget av inmatning. Vi är också 
av den uppfattningen att temat är väsentligt; det är nämligen där hela me- 
ningen får sin betydelse (att räkna substantiv som ett mått på ett visst inne- 
håll kan ju knappast vara tillförlitlig information, om satsen eller meningen 
uttrycker förmodande, negering eller liknande). Vi kodar också temat, vil- 
ket de Inquirer-baserade systemen inte gör. Vad vi har vunnit är dels att 
vi kan bygga upp lexikon med begrepp som bas (på samma sätt som Pisa- 
konventionen förordar när man talar om ordet som bas), samtidigt som vi 
har varje satstema redan i inmatningen. Dels kan vi arbeta med delar av 
texten, t ex de olika teman för sig och behöver inte det tidsödande arbetet 
att söka ett tema i varje mening genom hela texten, på basis av vissa ord, 
t ex inte' , som uttryck för negation. 

Ruta 1. Exempel på autentisk text i intervjumaterialet och preparering 
för kodning 



Frågan handlar om källor för kompletterande kunskap till det undersökta 
problemområdet. 

Svar: . . . Och, ja, sen hade vi T V- inspelningarna, där blev vi också 

hjälpta ganska mycket. Och så läsning. Det är väl dom huvudsak- 
ligen, dom källorna. Men det var väldigt bra att vara ute i fältet, 
faktiskt, det var det. - Nej, vänta lite grand, sedan så var det nå- 
gon, det var innan min tid, va, det var före min tid, det var på 
hösten - 68, då så hade A, tror jag, och B gått ut med en enkät till 
forskare, som - nej, fastän den användes nog aldrig, nej - dom 
tänkte göra det i alla fall, gå ut med en enkät till forskare, där 
forskare på institutioner och handledare lite runt om i Sverige 
skulle tala om vad dom menar med självständighet, men jag tror 
inte den gav så mycket, för vi använde oss bestämt aldrig av den. 
Men vi hade kunnat göra något liknande för sent ute bara. 

. . Ij Och, ja, sen hade vi TV-inspelningarnaJ/ där blev vi också 
hjälpta ganska mycket Jj Och så lä s nin g Jf /Det ä r väl dom huvud s ak* 
• ligen, dom källoviia/ KMen det var väldigt bra att vara ute i fältet, 

faktiskt, det var det. //- /Nej, vänta lite grand, sedan s- å var det nå - 

fl 
gon, det var innan-min tidj va/ ,/]det var före min tid, det var på 

hösten -68, |då så had e A, tr o r jag, oeh B gått ut med en - enkät till 

forskar e , eorn-~nej, fa o tän d o n användoo nog aldrig» n e j /-' dom 

tänkte göra det / t alla ' fall/ gå ut med en enkät till forskare, där 

forskare på institutioner och handledare lite runt om i Sverige 

skulle tala om vad dom menar med självständighet// men jag tror 

inte den gav så mycket/] för vi använde oss bestämt aldrig av den .| 

//Men vi. hade kunnat göra något liknande /j iför o ont ute baraj 



T eckenf örklar ingår 

Strykning av text t— 

Supplering skall ske _ 
Meningsavgränsning / 
Interpunktion kodas ej 
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En begränsning i GI- systemet till följd av att hel text matas in utan 
föregående preparering ; är att en hel del av det som har att göra med text- 
förståelse av pragmatiskt slag går förlorat. Pronomen är ett exempel. Vad 
eller vem ett pronomen refererar till framgår inte när datorn sorterar or- 
den. Vi har infört en suppleringsteknik, där referensen anges direkt efter 
begreppet i parentes (se I, Bierschenk, 1974). Detta illustreras i samband 
med presentationen av begreppskodning. 

Antingen meningen eller ordet tas som bas finns problemet med idiom, 
när man matar in hel text. Vad som är idiom, och inte är svårt att specifi- 
cera med hjälp av t ex idiom-ordlistor. Arbetet med GI har bl a inneburit 
att skapa rutiner för hur datorn känner igen idiomen ("key-word-in eontext- 
procedure"), men detta förutsätter att det finns ett begränsat eller känt an- 
tal idiom, vars struktur likaså kan förutses. Idiom- ordlistor måste be- 
traktas som otillräckliga, eftersom, såväl talare som skrivare lätt bildar 
egna idiom, som en sådan ordlista omöjligt kan täcka. Problem med så- 
dana pragmatiska drag i naturligt språk kan undvikas om kodning sker på 
basis av begrepp och inte ord. Till begrepp kan knytas flera ord, s k ord- 
strängar, som bildar egen "tag" (ett enskilt item) och datorn känner då 
igen en sträng med en specifik följd av ord. 

Användaren av GI- systemet får ingen syntaktisk information, vilket 
innebär att t ex subjekt-objektrelationer eller rollfunktioner inte framgår 
av en utskriven lista av ord. Om således en analys av ett politiskt doku- 
ment skall göras där meningar som 'USA anföll Vietnam/ och 'Vietnam 
anföll USA' ingår i texten, blir de betraktade som "innehållsligt" lika ge- 
nom den procedur som endast identifierar ord och räknar frekvensen. Vårt 
analyssystem har skapat koder för syntaktisk funktion, som tar handom 
sådana skilda satser som de exemplifierade och specificerar vem som an- 
föll vem i de två fallen. För detta kodsystem har ingående redogjorts i 
I. Bierschenk (1974), men presenteras åter i väsentliga delar i ett senare 
avsnitt i denna rapport. 

Redan 1966 ansåg Sto ne och andra att syntax- kodning är nödvändig för 
en förfinad analys "in the future". Men inte ens 1974 års förbättrade In- 
quirer har presenterat ett sådant system. 

Antingen man kallar sin analysenhet mening, begrepp eller ord för- 
ordar Pi sa -konvention en att ett item skall vara identifierbart. Denna 
förutsättning för att kunna återföra begrepp till ursprungstexten tillgodo- 
ses i vårt fall genom att varje begrepp har separat kort och därmed eget 
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3. 2 Inmatning 

Vår kodning sker på datablankett och har utformats så att vissa kolumner 
är specificerade för vissa typer av koder. Numerisk information i början 
eller i slutet av kortet, som konferensen rekommenderat, har tillgodosetts 
så att viss numerisk stansning sker i början och viss annan efter texten. 

3. 3 Identifikation 



Vår analys består av intervjusvar, där intervjuarens tal inte skall analy- 
seras. Det är endast intervjupersonens åsikter som återspeglas i textfölj- 
den. Men det kan hända att den intervjuade refererar till vad någon annan 
sagt eller tyckt och sådan information har vi velat särskilja och har skapat 
en särskild kolumn som vi kallar "källa" med två alternativa koder, 1 för 
intervjupersonens egna åsikter och 2 för någon annans. 

Figur 1 visar en kodad mening, där numeriska tecken i form av iden- 
tifikation, tema och syntaktiska (eller funktions-) koder framgår. Uppskriv- 
ningen på blanketten görs så tidsbesparande som möjligt, så att samma kod 
nedåt i kolumnerna inte upprepas. Vid stansningen upprepas koderna så- 
vida inte ny kod avbryter. Hur varje kort ser ut framgår av figur 2. Figu- 
ren visar också tydligt hur varje kort (begrepp) går att hänföra till texten 
genom att koderna upprepats vid stansningen. Angående de syntaktiska ko- 
derna skall här endast sägas att olika satser markeras genom looping till 
andra kolumner. Loop-koderna (fig 1) markerar i vilken satskolumn me- 
ningen fortsätter. 

3. 4 Rekommendationer från Pisa 

De rekommendationer (se s 13) som konferensen ansåg viktigast gäller 
uppbyggnad av register eller lexikon. En innehållsanalys av det här sla- 
get bygger alltid på ett lexikon, men principerna för hur det byggs upp 
kan variera. 

Den första rekommendationen avser särskiljande av typ (av ord) och 
fall (av samma ord). Svårigheter rapporterades med GI ifråga om distink- 
tionen mellan typ och fall. Vi har i hög grad undvikit detta problem genom 
att i förväg koda syntaktisk funktion. Ett begrepp som t ex ' bibliotek''' 
(vanligt i vårt provmaterial) kan vara subjekt (agent), objekt eller rums- 
bestämning. Den deskriptor som 'bibliotek'' får kan alltså variera, vilket 
betyder att varje typ innebär ny syntaktisk- funktionell roll och där- 
med nytt innehåll. Vi har sedan möjlighet att räkna frekvens per typ, om 
vi finner det nödvändigt. 

Den andra rekommendationen gäller bl a suffixbildning. Här ligger 
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Figur 1. Datablankett: Disposition och kodning 
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svenska språket närmare tyskan än engelskan och ordbildningen (samman- 
sättningar) sker på samma sätt. Vi har under en tid arbetat med register- 
konstruktion, vilket närmare redogörs för i kapitel 4. I det här samman- 
hanget skall endast nämnas att vi inte betraktar sammansättningar som 
"två ord", efters- n vi inte baserar vår analys på ord. En sammansättning 
som "socialforskning" blir hos oss betraktat som ett begrepp med annan 
betydelse än vad de två separata begreppen skulle ha» såtillvida att "forsk- 
ning" är generellt och kan innefatta "socialforskning", där "social" är en 
bestämning. Skulle vi i en sökningsprocedur vara intresserade av begreppet 
"social" i de varianter det kan förekomma, specificerar vi denna sökning 
genom ett trunkeringsförfarande (se vidare kap 4. 2). 

Vi kommer inte att få problem med långa register med fallen registre- 
rade i form av ändelser. Andel serna specificeras för varje kategori av be- 
grepp (vi håller t ex isär substantiv och verb) och finns i ett särskilt regis- 
ter. Häri liknar vårt system närmast GI s k "hash-list"- sökning (se sid 14). 

I följande kapitel redogörs för den kanske viktigaste aspekten vid regis- 
teruppbyggnad, nämligen förfaringssättet med ändelser. Redogörelsen ges 
ett eget kapitel, dels för att belysa vilka möjligheter vi har att behandla 
våra begrepp, dels och främst för att visa att man även på svenska kan ut- 
arbeta register för vidare datorbaserade analyser. I vilken mån oklarheter 
ännu finns kommer att framgå. 
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4. UPPBYGGNAD AV LEXIKONBAS 

4. 1 Urval av begrepp 

Begreppen är i kodsystemet indelade enligt funktion (och ofta position) i 
satsen. I likhet med traditionell satsanalys betyder det att det i subjekts- 
position kan stå ett verb. men att ett begrepp som till ordklassen är sub- 
stantiv kan ha. verbfunktion, även om sådana ordklassbyten inte är den van- 
ligaste representationen, Nedan skall redogöras för på vilket sätt vi kan 
ta ut vara begrepp ur det inmatade materialet. 

Om vi vill veta hur mänga och vilka adjektiven är beställer vi ut ur 
materialet de koder som innebär attribut med innebörden beskrivning eller 
klassificering av ett huvudord. Alla handlingar registreras i verbkod. Sub- 
stantiv kan finnas i agent- eiler objekt-koderna, men även i sådana koder 
som ligger utanför paradigmet A a O r t ex inom rumsadverbial. Nu har vi 

i första hand varit intresserade av att studera koderna inom. paradigmet, 
så specificeringen av substantiv blir begränsad till agent, objekt eller mål. 

Ett begrepp kan bestå, som tidigare framhållits , av flera ord. vilket 
ofta betyder en ordsträng, där huvudordet omges av artiklar och preposi- 
tioner. Detta gäller framför allt substantiven. För att få en bas för regis- 
ter av de begrepp som förekommer inom de olika koderna behövde vi först 
låta skriva ut de koder vi ville ha, sortera dem när partiklarna borttagit s 
samt genom trunkering på olika sätt skapa möjligheter för sökning på dessa 
begrepp i dels olika böjningar och sammansättningar, dels olika koder, 
där de kan tänkas förekomma. Hur begrepp kan begränsas genom trunke- 
ring redogörs för nedan. 



4. 2 Trunkering: Syfte och principer 

Begreppet trunkering kan sägas innebära att en avgränsning av element 
inom ett ord eller en viss specifik koppling av ord inom ett begrepp sker. 
När man vill söka sig fram till relevant information inom stora datamäng- 
der, t ex litteratur inom ett referatorgan, är man intresserad av att de 
termer som man söker genom är så entydiga som möjligt, så att inget 
brus uppstår i form av överflödsinformation, B. Bierschenk (1973, s 69) 
förklarar begreppet trunkering på detta sätt: 

"För att skapa flexibilitet har man infört ett förfaringssätt som kallas 
trunkering, vilket innebär att man vid en maskinell sökning kan utnyttja 
ordstammar. 

Genom att man kan trunkera ett ord på såväl höger som vänster sida 
blir även inorn ramen för en automatiserad sökning en utskrift av titlar 
trots varierande prefix och suffix möjligt,. " 
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För att bygga upp begreppens register kan man sålunda utnyttja likheter 
och olikheter inom och mellan begrepp. Dels kan man undvika att behöva 
arbeta med olika böjnings andels er, som utan ett trunkeringsförfarande 
skulle betraktas som "olika ord" av en dator, dels kan man genom att en- 
bart arbeta med ordstammar (främst i sammansättningar) "gardera" för 
att samtliga i ett material förekommande sammansättningar återvinns i en 
sökning. På vilket sätt detta sker illustreras genom trunkering av begreppet 
'beteende tillsammans med de kombinationer som SÖK-projektets mate- 
rial hittills skulle utvinna. (Trunkeringen utmärks med asterisk. ) 

Ruta 2. Resultat vid trunkering av begreppet beteende 



Sökord 



Sökord 



beteende* 

beteende* n 
beteende* t 
beteende* sidan 
beteende* vetare 
beteende* vetenskap 
beteende * modifikation 

* beteende 



självständighets * beteende 



Högertrunkering betyder alltså att ordet till och med asterisken samt allt 
efter är relevant, vänstertrunkeringen garderar för ett föregående sam- 
mansättning si ed. En dubbel trunkering (*beteende*) innebär därmed att 
samtliga begrepp utfaller i en och samma sökning, som ruta 2 visar. 

I utfallet efter högertrunkeringen visar det sig att såväl ändelser (-n, 
-t) som begrepp innefattas i detta. Om man önskar begreppet beteende' 
utan efterled bör en rutin införas som först tar hand om de tänkbara ändel- 
serna hos varje begrepp. Vi måste således ha ett ändelseregister innan 
vi genom trunkeringsförfarande kan söka igenom materialet på begrepp 
och begreppskombinationer, I detta första stadium har endast högertrun- 
keringar gjorts, vilka enbart avsåg ändelser, varvid samtliga möjliga än- 
delser registrerades. (I annat fall blir registret begränsat till det mate- 
rial vi hittills har bearbetat. ) 

Vi har utarbetat register för adjektiv, verb och substantiv såsom 
framgår av följande beskrivning. 

4. 2. 1 Trunkering av adjektiv och verb 

Generellt har här utgåtts ifrån att ett begrepp skall trunkeras så att så få 
ändelser som möjligt skall behöva registreras. Som ändelser betraktas 
därför här det eller de element (vi kan kalla det bokstäver) som om de 
förekommer efter asterisken ger en annan betydelse (i genus, kompara- 
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tion eller tempus) åt begreppet. Enkelt uttryckt kan vi säga att så långt 
som begreppetutan dessa element stavas lika, så långt trunkeras det. Men 
där stammen i begreppet har omljud, dvs annan vokal, registreras begrep- 
pet lika många gånger som. antal stamvokaler. Ruta 3 visar principerna 
för trunkering av adjektiv och verb. 

Ruta 3. Exempel på trunkering av adjektiv och verb 



j Adjektiv 

stor* 

! Stör* 

; fin* 

; hjälpsam* 

: Verb 

| arbeta* 

i bjud* 

; bjöd* 

j Slå* 

1 slog* 

! slag* 



Utfali/ändelser 



-t. -a 




-re, -st, - ste/a 




-are, -a st. -aste, -a, -t 




-mare, -mast. -måste, -ma/e, 


-t 


-r, -de, -t^-d , -s, -ts, -des 
-a, -it, -en ', -s. -es, -its 






-s 




-r , - s 




-it, -its , -et' 1 ' f , - en 





i) participform (ibland som adjektiv) 

s- formerna innebär att vi garderar även för passiver 

(möjligheten att säga -'det bjöds" finns) 

I en nästa uppbyggnadsfas kommer tempusformerna att sammanföras till 
ett begrepp som representerar de övriga. Vi har temakoder, som speci- 
ficerar tempus i varje sats. (Jfr systemet WORDS, s 14.) 

4. 2, 2 Trunkering av substantiv 

Ändelserna för substantiv blir naturligt nog fler än för adjektiv och verb 
på grund av de mänga deklinationernas olika böjningsmönster och bestämd 
och obestämd form i olika genus. Dessutom har vi även här s-former som 
avser genitiv och som kan förekomma i samtliga andra former. 

Även här förekommer pluralböjning med annan stamvokal, vilket be- 
handlas på samma sätt som vid adjektiv och verb. 

Ett av svenskans vanligaste avledningssuffix till substantiv är -ning. 
Detta betraktas inte som ändelse här, eftersom vi i så fall skulle få flera 
betydelser på en trunkering, som t ex skulle gripa över såväl abstrakta 
som konkreta begrepp, vilket skulle göra det svårare vid uppbyggandet av 
registren. Som exempel kan anges bokförsäljare, bokförsäljning; en trun- 
kering bokför sälj* är alltså överlappande inte bara med hänsyn till böj- 
nings andel ser. Ändelser betraktas på samma sätt här som ifråga om ad- 
jektiv och verb. Principerna vid trunkeringen behöver inte ytterligare 
presenteras. Exempel på vilken betydelse avledningsändelser har jämfört 
med böjningsändelser skall dock ges. Ruta 4 beskriver således substantiv- 
trunkering som är garderad för avledningsskiljaktigheter. 
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Ruta 4. Exempel på trunkering av substantiv: Avledning jämfört med 
böjnings andel ser 



Trunkering 


Utfall/ändelse r 


arkivarbet* 


1) -e, -et, -ets, -en, -ena, -enas 




2) -are, -ares, -arens, -arna, -arnas 


arkivarbete* 


-t, -ts, -s^ -n, -na, -nas 


arkiva rbetar * 


-e, -es, -ens, -na, -nas 



Det torde vara självklart att endast den senare typen är tillfredsställande. 
Även liknande fall skulle kunna diskuteras, där skillnaden genom avlednings- 
ändelsen tycks mycket liten, t ex anmälan och anmälning. En viss skillnad 
finns dock och här har det genomgående utgåtts ifrån att det är fråga om 
begrepp med olika betydelse. 

Här har diskuterats trunkerings princip er på basis av begreppet ord- 
klass, trots att våra begreppskoder inte i första hand är ordklasser. Men 
ändelseregistren har vi velat bygga upp så att vi kan specificera ett sök- 
ord till att gälla ett begrepp inom en ordklass och inom en kod. I det fall 
ett verb står i agentposition (t ex "subjekt" i form av att-fras) och vi an- 
vänder den trunkerade formen för ett verb vi vill ha ut, kan vi genom att 
specificera den syntaktiska koden undvika vissa o önskade utfall. Vi har 
alltså dubbel gardering. Trunkeringsproblem kan illustreras med två be- 
grepp, ansvara respektive ha ansvar för , Dessa kan t ex båda vara 
verb, som i vårt system har kod 40 (se fig 1). Om vi i verbregistret har 
begreppet ansvara* och gör en sökning med detta och samtidigt specifice- 
rar det till kod 40, får vi inte ut ha ansvar för' som verb, eftersom -a 
finns med till vänster om asterisken. Hade vi däremot haft ansvar* hade 
båda begreppen utfallit, eftersom -a är verbändelse (se ruta 3). Den se- 
nare trunkeringen förutsätter att de båda varianterna för "samma" verb 
har samma betydelse. Om så skulle vara fallet och den sista trunkeringen 
gälla, betyder det att principen för trunkering av enkla verb kunde komma 
att ändras, så att -a faller utanför asterisken, men det syns för närvarande 
som en mindre bra lösning, framför allt med tanke på att kanske inte alla 
substantiv med verbbetydelse generellt har samma innehåll som sitt re- 
spektive verb. Sådana praktiska överväganden vid registerkonstruktion är 
principiellt viktiga. Vi är ännu inte helt färdiga med denna konstruktions - 
fas. Vi väntar på att få veta om de ovan diskuterade verben kan samman- 
falla eller bör representeras i registret som var sin typ. 

Distinktionen mellan typ och fall som diskuterades i Pisa gäller så- 
lunda inte enbart syntaktisk betydelse skillnad. Den eventuella skillnaden 
har vi specificerat genom kodningen. Möjlig skillnad i varianter är för 
oss väsentligare, vilket GI- systemet inte alls diskuterar. Den frågan är 
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inte aktuell när man baserar sina lexikon på ord. Ord blir med nödvändig- 
het kategoris era de i ordklasser, oavsett funktion i kontexten. 

4. 3 Empirisk bas 

Hittills har varje begrepp betraktats som ensamt och olikt varje annat be- 
grepp. Vilka sona skall anses som lika, dvs ha samma betydelse och såle- 
des genom ett trunkeringsförfarande endast en gång representeras i ett 
lexikon är ännu inte klarlagt. "Betydelse" blir i det här fallet bestämd ge- 
nom skaleringstekniken med Osgoods semantiska differentialer. Samma tek- 
nik har använts i GI för att bestämma ett värde ("value") för de ord man vill 
använda i sin analys. Principen är i korthet den att adjektiv och verb får 
ett värde på en 7-gradig skattnings skala inom tre dimensioner (pos-neg, 
akt-pass, stark- svag) genom att ett antal bedömare skattar dem. Dessa 
medelvärden är det "value" som används för bestämning av substantivs inne- 
håll, på så sätt att substantivs frekvens multipliceras med medelvärdet för 
det adjektiv eller verb som står tillsammans med substantivet i en text. På 
vilket sätt vi kommer att använda denna metod skall redovisas vid ett se- 
nare tillfälle. Skattningar har genomförts och statistiska beräkningar före- 
ligger men är ännu ej analyserade. Dessa resultat är av vikt för register- 
uppbyggnaden i bl a de fall som diskuterats ovan. Kan vi komma fram till 
att två begrepp har lika betydelse förs deskriptorer enbart till 
detta begrepp med hänvisning till varianter som återfinns i ett särskilt re- 
gister. 

Genom att empiriskt kunna bygga upp registren anser vi att vi uppfyllt 
Pisas rekommendationer långt utöver vad som avsetts. Våra lexikon kom- 
mer att innehålla distinktionen mellan typ och fall, dels empiriskt förank- 
rad ifråga om adjektiv och verb. som ju skall bilda basen för en kvanti- 
fiering av substantiv, dels en syntaktisk-funktionell distinktion, som vi 
kan använda oss av för utvidgningar och begränsningar i sökningarna, be- 
roende på vilken problemställning vi har, t ex "Vilken värdering uttrycks 
i de handlingar som utförs av X"? eller "Hur värderas den handling som 
innefattar X som objekt' 1 ? 

Vi kommer att få lexikon som är uppbyggda enligt förhållanden som 
gäller svenska språket och dessa lexikon utarbetas med det autentiska ma- 
terialet som grund. Problemet med sammansättningar behöver vi inte ta 
ställning till, eftersom vi låter hela begrepp ingå i lexikonet och vi ändå 
kan söka sammansättningar genom trunkeringar. 

Det torde stå klart efter denna schematiska presentation av lexikon- 
uppbyggnad att det går att utarbeta regler för registrering med svenska 
språket som bas och att det är nödvändigt för varje innehållsanalysforskare 
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att skapa sin egen lexikonbas beroende på vilken språklig teori han bar. 
Pisa -konferensen visade hur olika problemställningar ger nya problem 
med den språkliga representationen. Att bygga på det enskilda ordet är 
egentligen inget uttryck för en språkteori, snarare ett övervägande som 
gäller vad som är praxis vid datorbearbetning av text. Det enskilda ordet 
blir sen kategoriserat enligt någon samhällsvetenskaplig teori, där det en- 
skilda ordet betraktas kontextfritt. 

I vår analys är begreppen kontextbundna enligt en teori om relationer 
mellan beroende och oberoende begrepp och rollfunktioner. Det är efter 
dessa förutsättningar kodningen sker och vidare analys skall bli möjlig. En 
kodning av naturligt språk är en lyssnar företeelse. Vad datorn skall åstad- 
komma är inte en förståelse av text utan en strukturering av texten såsom 
vi specificerat input. 

Följande kapitel skall behandla den teori för språklig representation 
som vi har funnit vara den mest tillämpliga i vårt fall. Det diskuteras ock- 
så sådana fall, där vi har låtit praktiska överväganden gå före teorin. 
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5. REPRESENTATION OCH KODNING AV BEGREPPSSTRUKTURER 

I föregående kapitel har presenterats våra analysenheter, på vilket sätt 
inmatning sker, hur identifikation specificeras i kodningen och på vilket 
sätt vi har tänkt oss att bygga upp vår lexikonbas. I detta kapitel 
skall presenteras hur våra begrepp representeras genom kodningsregler 
(kolumnerna 66 - 80, fig 1). 

Den teori som vi funnit mest intressant för vår analys är Schank y s 
(1973) "conceptual dependency theory" som närmast kan hänföras till om- 
rådet matematisk lingvistik. Denna teori kom vi i kontakt med efter att 
våra första kodningsregler utarbetats, men vi fann att den ligger väl i 
linje med vårt sätt att behandla texten för input och den kommer att vara 
vägledande i fortsättningen, dock med vissa inskränkningar av praktisk 
natur . 



5. 1 Teoretisk ram 

En analys av språk måste röra sig på två nivåer, dels en meningsnivå 
("sentential level"), dels en begreppsnivå ("conceptual level"). Den första 
bildar basen med meningen som största enhet, den andra innebär begrepps- 
komplex ("conceptualization") och satser med begrepp som enheter (se Schank, 
1973, s 191). Det finns tre elementära slag av begrepp, "a nominal, an 
action, or a modifier". Dessa begrepp är antingen oberoende eller bero- 
ende. Nominal, dvs substantiv, är oberoende, alltså självständiga begrepp 
som inte behöver något tillägg för att förstås. Alla andra är beroende, dvs 
de måste relateras till andra begrepp för att få fullständig betydelse. 
Med modifier menas antingen adverb eller adjektiv. Verbet ("action") be- 
traktas som "oberoende", men dess betydelse specificeras genom det eller 
de substantiv det sätts i samband med. Nominalen kallas hos Schank PP 
(för "picture producer"), verben ACT, adjektiven PA ("picture aiders") 
och adverb en AA ("action aiders"). Dessa förkortningar används i fort- 
sättningen vid jämförelsen mellan denna teori och vår analys. Egenskaperna 
hos begreppen gäller den conceptuella nivån och inte meningsnivån. Man 
kan ju ha en mening utan verb eller ett adjektiv utan sitt substantiv och 
yttrandet är ändå fullt förståeligt och betraktas som en mening i kommu - 
nikativt sammanhang. Det gäller däremot inte på begreppsnivån. Där gäl- 
ler beroenderegler mellan begrepp, som. indikerar attett beroende förut- 
sätter att ett oberoende existerar. 

Detta förhållande mellan mening ("sentence") och mening ("meaning") 
är den väsentligaste frågan när man vill utveckla ett datorbaserat system för 
innehållsanalys. Vi vill analysera innehåll via begrepp och deras relatio- 
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ner och inte syntaxen i sig själv. Schank (1973, ss 189-190) framhåller 

följande : 

"Regardless of the purpose, however, it is the meaning of an input sen- 
tence that is needed not its syntactic strueture. /. . . / rather than doing a 
complete syntactic analysis and then submitting the results of this analysis 
to some semantic interpreter, we would like to use syntactic information 
as a pointer to the conceptual information. " 



5. 2 Representation och kodning av begrepp 

En "conceptualization" uttrycker en händelse och kräver således ett verb 
och minst två substantiv. Hur en sats tolkas beror på de conceptuella reg- 
lerna. Det existerar formellt definierade beroenderelationer mellan givna 
kategorier av begrepp. Det är dessa beroenden som utgör strukturen på be 
greppsnivån. 

Schank har utvecklat ett s k C-diagram ("conceptual dependency net- 
work") för att symboliskt uttrycka beroenden mellan begrepp. Sex grund- 
regler finns för ett sådant nätverk och dessa beskrivs nedan (ur Schank, 
1973, s 195). 

Ruta 5. Exempel på conceptuella regler 



C-regel 



Exempel 



j 1. PP <--» ACT 

j 2. pp<?£3# pa 

I 3. PP^ PP 

1 4. PP 

i A 



PA 
5. PP 

!> 



John £=r^> hit ( ^ — 

John < -== =*> tall 
John ^~5~s? doctor 

John 

r 



Mary) 



—I 



PP 



tall 
man 



N. Y. 



dog 
LO C j) 

John 



POSS-BY 



6. ACT\— ~PP (John £=*> ) hit 4~1_ Mary 



Regel 1 . Denna regel säger att PP kan handla och när de gör det existerar 
ett ömsesidigt beroende mellan dem. Regeln säger däremot inte att alla PP 
kan handla eller att vilken PP som helst kan utföra alla handlingar. Re- 
geln rör alltså syntaxen på begreppsnivån, (Semantiska regler skulle tala 
om vilka PP som kunde utföra vilka typer av ACT. ) 

Regel 2. Det är möjligt att predicera ett attribut till ett speciellt PP. 
Denna relation indikeras med ,^-— A . För att en "conceptualization" 
skall existera mellan dessa två items är båda lika nödvändiga och beroen- 
det är alltså ömsesidigt. 



- 31 - 

Regel 3. Man kan också predicera "gruppgemenskap" ("set membership") 
mellan två PP, 

Regel 4. Man kan referera till ett begrepp och ett attribut till detta begrepp, 
vilket redan tidigare nämnts i kontexten. 

Regel 5. Två conceptuella objekt kan relateras till varandra på olika sätt. 
Principiellt finns tre sätt: innehåll ("containment"), plats ("location") och 
tillhörighet ("possession"), markerade genom il . Begreppet under pilen 
specificerar (är beroende till) begreppet över. 

Regel 6. Regeln anger objekt-beroende. ACT fordrar ett PP. En given ACT 
kan kräva ett objekt, andra gör det inte. De som gör det måste ha ett ob- 
jekt på begreppsnivån, även om det inte uttrycks på meningsnivån. 

När det gäller att på ett systematiskt sätt använda dessa principiella 
regler för inmatning av text i dator måste man finna på ett sätt att genom 
kodsystem representera begrepp och begreppsrelationer. Väsentligt är att 
påpeka att semantiska regler eller tolkningar inte i första hand skall ut- 
tryckas genom kodningen på den här nivån. En tolkning av texten är dock 
ofrånkomlig; i annat fall kan man ju inte heller segmentera begreppen. Att 
därför påstå att syntax och semantik skall särskiljas är inte hållbart, ef- 
tersom syntax och semantik är varandras förutsättningar. Vi har använt 
oss av syntaxen för att med ledning av denna struktur kunna avgränsa be- 
grepp i en sats eller mening. 

Som tidigare nämnts vill vi huvudsakligen bygga upp våra meningar en- 
ligt paradigmet A a O. Vi skall här försöka visa hur förhållandena mellan 
dessa beteckningar symboliskt kan kodas. Dessutom har vi genom kodsy- 
stemet försökt ange be roende struktur en inom begreppskomplexen. På vil- 
ket sätt vi ansluter oss till Schanks språkteori redovisas i ruta 6. 

Ruta 6. Jämförelse mellan C-diagram och ANACONDA: 
Begreppskodning 





C-diagram 


ANACONDA 


1. 


PP $==* ACT 


30 + 40 


2. 


PP £=^ pa 


30 + 41 + 32 


3. 


pp £=^ pp 


30 + 41 + 30 


4. 


PP 

t 

PA 


32 + 30 


5. 


PP 

$ 

PP 


30 + 33 

31 + 30 


6. 


ACT<-^-PP 


40 + 50 
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Vårt kodsystem är uppbyggt så att varje begrepp specificeras genom 
en tvåsiffrig kod. A a O uttrycks som 30 + **0 + 50. Kod 30 innebär agent - 
elier subjektfunktion- (Vi anger inte oin agent är person eller abstrakt be- 
grepp. En senare kategorisering av respektive kod kommer att ta hand om 
sädana bestämningar.) Ett begreppskomplex består av huvudord och bestäm- 
ningar av olika slag. Huvudbegreppet har en kodsiffra som slutar på , me- 
dan beroende begrepps slutsiffra är 1 , 2 eller 3. 

Förhällandet mellan PP och PA uttrycker beroende, där PA är be- 
roende begrepp till PP. Detta slag av beroende inom PP- strukturen ut- 
trycker vi genom sifferkombinationen (30 + 32). Regel 2 säger att den 
"conceptuaiization" som bildas fordrar ett 'är' . Kopula-verb särskiljs 
hos oss frän handiingsverb och får kod 41 Det gör det också lätt för oss 
att i materialet urskilja alla meningar som uttrycker värderingar och klas- 
sificeringar i form av predikativa påståenden. 

Regel 3 fungerar på samma sätt, men här är utfyllnaden inte ett attri- 
but (adjektiv) utan ett substantiv, lika oberoende som det första, 

I stället för 'är' -konstruktion kan förhållanden mellan PPoch PA ut- 
tryckas såsom regel 4 visar. Adjektivet står framför sitt substantiv (t ex 
'den långe mannen'). Schanks pil under PP betyder att detta begreppskom- 
plex inte bildar en syntaktiskt fullständig mening, eftersom ACT saknas, 
dvs ett begrepp som står horisontellt i förhållande till PP. Detsamma gäl- 
ler den femte regeln. som visar beroendet mellan substantiv inom ett be- 
greppskomplex. Enligt Schank finns det tre slag av beroenden som uttrycks 
med denna regel, "containment", "location" och "possession", Vi kallar 
detta för framför- eller efterställd bestämning, som inte är adjektivattri- 
but. Som 30+33 skulle vi koda alternativen 'mannen i New York'", 'ärterna 
i burken'; 'burkens ärter' däremot som 31 +3 0. ' Johns hund' (se ruta 5) 
är ett ägandeförhållande uttryckt i genitivform, som i vårt fall kodas ge- 
nom 31 + 30. 

Regel 6 anger beroende mellan verbet och objektet. Schanks symbol 
säger att ett beroende finns, såtillvida att ett verb kan fordra ett objekt i 
en fullständig conceptuaiization, men att objektet inte för övrigt är ett 
beroende begrepp. Det är endast i den horisontella linjen som det i vissa 
fall är nödvändigt. Detta förhållande avser frågan om transitiva och in- 
transitiva verb. Vi kodar objektet ined en oberoende kod, eftersom ett PP 
i denna ställning som begrepp har samma struktur som ett PP som agent. 
I en mening kan nämligen finnas begrepp som hänförs till objektet i form 
av bestämningar av olika slag (se ruta 7). Hade vi tilldelat objektet en kod 
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som fick det att tillhöra verbet (någon siffra på 40) hade vi inte fått symme- 
tri mellan agent respektive objektkomplexen. I stället skiljer vi på slaget 
av objekt. Det objekt som kodas med 50 är det som hör närmast till verbet, 
motsvarande det som traditionellt brukar kallas direkt objekt. (Ett andra 
objekt finns och detta presenteras längre fram. ) 

Innan framställningen går vidare med nya jämförelser exemplifieras 
vår kodning av en basmening ( 'John hit his little dog 7 ), som Schank inled- 
ningsvis har presenterat, för att visa hur hans språkteori kan praktiskt an- 
vändas i input. 

Ruta 7. Jämförelse mellan C-diagram och ANACONDA: En basmening 



C-diagrara 



ANACONDA 



John<=)hit 



dog 

\ 
little 



<t 



POSS-BY 

John 



John . 
hit(s) 1 ' 
his (Johns) 
little 
dog 



30 
40 
51 
52 

50 



tempus är ej markerat i C- diagrammet 



Ur rutan framgår på vilket sätt objektet behandlas. Det har samma grund- 
struktur som (agenten) subjektet om man utgår från deras sammansättning 
av oberoende och beroende enheter. För att understryka och hålla isär PP 
syntaktiskt har vi således det tvåsiffriga kodsystemet. Därigenom kan vi 
särbehandla begreppen på ett flexibelt sätt. T ex var det mycket lätt att ta 
ut alla adjektivattribut inför den skalering vi genomfört, eftersom de är 
specificerade genom den andra siffran i koden. 

Förhållandet mellan de två PP ''John'' och 'dog' måste få sin represen- 
tation på ett otvetydigt sätt. Eftersom vi inte arbetar med automatisk igen- 
känning av items utan förbereder den maskinella databehandlingen manu- 
ellt, specificeras alla pronomen genom en supplering inom parentes. (Se 
vidare under kap 5. 3. ) Schank (1973, s 196) säger följande om förståelsen 
av naturligt språk: 

"... in attempting to uncover the actual conceptualization underlying a 
sentence, we must recognize that a sentence is often more than its com- 
ponent parts./. . ,/ln fäet, a dialogue is usually based on the information 
that is left out of a sentence but is predicted by the conceptual rules. " 

Den information som är utelämnad men som kan prediceras genom be- 
roendestrukturen mellan begrepp är i detta sammanhang viktig för vår 
analysmetod. Pronomens referens är det första vi måste ta hänsyn till för 
att kunna arbeta med de begreppen. Utan referens till begreppen skulle ett 
mycket stort material gå förlorat, vilket också diskuterades i samband 
med GI. Emellertid är pronomens referens inte en huvudfråga i det här 
sammanhanget. Utfyllnaden av ett begreppskomplex (t ex inom agentstruk- 
turen) eller de nödvändiga delarna i det syntaktiska paradigmet är teore- 
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tiskt intressantare i en teori om begreppsformationer eller image "under- 
lying a sentence". Vi skall gå vidare och redogöra för vad Schank avser 
med und er liggande strukturer. 

Det centrala i Schanks resonemang är betydelsen i verbet. ACT inne- 
bär en händelse eller ett skeende som uttrycker rörelse eller stillastående. 
Ett rörelseverbs riktning brukar av språkforskare betecknas med transiti- 
vitet. En conceptualisering innebär i dessa fall att man vet målet för denna 
riktning eller att man känner till att ett mål bör finnas. Schank redogör för 
sin teori om TRÄNS genom ett antal meningar med verb som innefattar 
underliggande men nödvändiga kasus. 

Ex. The man took a book / analyseras begreppsmässigt: 

book 



p o 
man < > take i 



(p in dikerar t empus, "past", o anger att verbet fordrar objekt. ) 

Denna mening är inte fullständigt representerad i och med att verbet take 
förutom objekt måste ha begrepp för "från vem eller vad" samt en motta- 
gare. Nätverket ser ut så här: 

to 
take 



man 



«=£=* 



book 



R 



from 



man 



(R står för mottagaren, "recipient". Detsamma gäller verbet / give', 
men med x känt t ex from I '. ) 

De "conceptualizations" som ligger under meningarna 'The man took a 
book' respektive 'i gave the man a book' representeras på det här sättet: 



man < 5 > TRÄNS f- 



-book 



R 



to 



from 



man 
someone 



TRÄNS <- 



o 



book 



R 



to 



from 



man 

I 



'Give' definieras som TRÄNS när agent och källa ("originator") är iden- 
tiska, 'take' är TRÄNS när agent och mottagare är identiska. Schank 
(s 198) förtydligar: 

"This conceptual rule states that certain ACT's require a two-part reci- 
pient in a dependency similar to that of objective dependency. The simi- 
larity lies in the fact that this type of dependency is demanded by certain 
members of the category ACT. If it is present at all, it is because it was 
required. /.../... a conceptualiaation is not complete until all the con- 
ceptual cases required by the ACT have been explicated. " 

De fyra conceptuella kasus som Schank arbetar med är OBJECTIVE, 
RECIPIENT, DIRECTIVE och INSTRUMENTAL. Dessa kasus representeras 
i de C-diagram såsom ruta 8 visar. Regel 6 från ruta 6 upprepas här. Som 
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jämförelse presenteras på vilket sätt ANACONDA- systemet skulle koda 
dessa kasusförhållanden. 

Ruta 8. Jämförelse mellan C-diagram och ANACONDA: 
Conceptuella kasus 



C-diagram 



! 6. ACT < PP 



! 7. ACT «~~ 5 i 



r » PP 



, PP 



i 8. ACT f- 



I f? 



y 



| 9. AC r 



±j 



f- 



- * PP 

L. __^ pp 



ANACONDA 



40 + 50 

3 + 40 4- 50 4- 7 

40 -f 45 

30 t 40 4- 44 

30 i 40 4- 50 4- 44 



Regel 6 har redan förklarats. 

Regel 7 säger att en handling som har ett PP som mottagare också måste 
ha ett PP som är initiativtagare eller agent förutom det PP som är kopplat 
till verbet, dvs en sådan handling fordrar två objekt. Vårt andra objekt har 
koden 70 och har alltså samma struktur som övriga oberoende begrepp i 
paradigmet. Vi har i kodningsreglerna kallat detta objekt för indirekt (en- 
ligt traditionellt sätt att analysera satser) eller mål ("goal"). 

Regel 8 visar att det kasus som kallas instrument genom den lodräta 
pilen kan betraktas som beroende till handlingen. Hos oss motsvaras det 
närmast av ett sättsadverbial. 

Regel 9 förklaras av Schank (197 3.. s 202) så här: 

"The DIRECTIVE case indicates that PP's may serve as direction indica- 
tors of a directional action. /. . . / The directive case is extremely similar 
to the recipient in form and is almost in complementary distribution with 
it , That is, the two never appear together and would seem to be different 
forms of the same phenomenon, The most common ACT that take directive 
case is 'go', " 

Kod 44 har hos oss specificerats som rmnsadverbial, som uttryck för så- 
väl befintlighet som riktning. Det visade sig dock vid kodningen att det var 
svårt att skilja mellan "riktning vart" och "mål". Detta är senare löst så 
att kod 44 används både som riktning och befintlighet ifråga om agentens 
läge. Om handlingen innefattar ett objekt, som byter "ägare" används ko- 
den för mål, dvs motsvarande recipient. Skillnaden förklaras genom föl- 
jande två meningar: 

Jag skickade papperen till institutionen 
30+40 + 50 4- 70 

Jag reste till/ bor i/ Stockholm jfr Jag la papperen på bordet 
30 4-40 / 40/ 4- 44 30 4-40 4-50 4- 44 

Hittills har vi inte skilt på riktning och befintlighet. Vill vi av någon anled- 
ning göra det behöver vi bara kopplingen mellan 40 och 44 för att se vilket- 
dera som uttrycks i adverbialkoden. Observera att kod 44 inte uttrycker 
"location" enligt regel 5 (ruta 5), där LOC är bestämning. Exemplet med 
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30 + 40 + 50 + 44 betyder att agenten samtidigt med handlingen befinner sig 
i närheten av det PP som uttrycker plats. 

Skillnaden mellan objekt och instrument kan vara besvärlig att reda ut. 
Schank (1973, ss 199-200) tar ett exempel: 
John grew the plants with fertilizer/ 
Begreppet 'fertilizer' är det syntaktiska instrumentet till 'grew'. Men hur 
är det på den conceptuella nivån? Ja, han menar att verbet 'grow' inte kan 
vara en handling som en person kan utföra mot någonting. Det är växterna 
som blir större av det som John gjorde. Det är alltså fråga om en föränd- 
ring av tillstånd, vilket måste uttryckas i en ny regel: 

Regel 1 0. PP <£( 



* PA 
-<PA 



som, representerad i meningen ovan, blir: 

-> size = x + y 



plants ^E 



-x size = x 



Johns handling representeras genom ett s k dummy-verb, 'do': 

I 



John £=> do 



fertilizer 



Därmed har vi fått två conceptuali ser ingår som måste relateras till var- 
andra på något sätt, nämligen genom ett orsakssamband, som anges med 
mellan de två satserna ( i anger att orsakandet var avsiktligt, "inten- 
tional"): 

P I 
John / ' \ do <= — fertilizer 

Ijl i ( } phys st size = x + y 



plants 



phys st size = x 

Egentligen är 'fertilizer' inte instrument utan objekt, eftersom följande 
antagligen hände: John tog gödselsäcken och gick fram till växterna och 
hällde ut innehållet på marken där växterna stod. Detta fick växterna att 
växa. På begreppsnivån är detta ett annat slag av TRÄNS; 

■»plants ground 



P 



John t-*-} TRÄNS e 



fertilizer <r 



D 



It* 



^<bag 



i — »phys st size = x + y 
plants ^=3 

I (phys st size = x 

Slutsatsen är att vad som såg ut att vara ett syntaktiskt instrument, dvs 
instrument på menings planet, är på begreppsplanet ett objekt. Detta hän- 
der alltid med ett syntaktiskt instrument, säger Schank, eftersom ett en- 
samt PP inte kan vara conceptuellt instrument utan bara objekt till en 
handling. Detta är förklaringen till regel 8 ovan. 

På detta sätt fortsätter Schank att utreda underliggande strukturer i 
meningar. Representationen av meningen 'John ate ice cream with a 
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spoon' har ett ännu större nätverk på den conceptuella nivån i och med att 
verbet äta' innebär en serie handlingar som var och en har nödvändiga in- 
strument, t ex 'ta skeden', röra handen med skeden mot glassen' osv. 
Schank menar att varje handling kräver ett instrumentellt kasus, men man 
behöver inte ange dessa vid verb som 'äta', där varje lyssnare vet vilka in- 
strument som erfordras och vilka som kan vara möjliga. Man tänker inte 
aktivt på dem. Vid kodning av naturligt språk, på det sätt en lyssnare gör 
när han förstår vad en talare säger, finns alla handlingsserier implicita i 
ett sådant verb. Målet för oss är att ange vilket begrepp i satsen som indi- 
kerar handling. Underliggande handlingar och instrument är irrelevanta. Av 
den anledningen kan vi gå förbi regel 10, som säger att ett PP kan byta till- 
stånd. Allmänt är regeln riktig, men inte för oss i det här sammanhanget. 
En mening som 'Han gödde växter' kodas 30 + 40 + 50. Att växterna därav 
blir större får vi anta och den innebörden finns i verbet utan att det behö- 
ver anges med en relaterad sats 'så att växterna blev större' eller liknande. 
På samma sätt skulle vi göra i 'Han gladde mig'. Vari handlingen bestod 
vet vi inte och vi behöver inte heller veta det för att kunna representera 
begreppen i en kodning. 

Den diskussion som förs angående skillnaden mellan objekt och instru- 
ment behöver inte bereda oss några problem. Vår kod 45 som anges i re- 
gel 8 kan ses både som instrument och objekt. Siffrorna i koden anger dock 
att begreppet hänför sig till verbet som modifierare, dvs inom 45 har vi 
sättsadverbial, som kan bestå av adverb eller substantiv. Innebörden i 
denna kod är: pä vilket sätt utförs en handling, tillvägagångssätt eller me- 
tod? Koden har hittills också innefattat gradadverb och har fått hög fre- 
kvens, vilket motiverar att den delas. Det går dock inte att utgå från di- 
stinktionen substantiv- adverb, eftersom substantiv kan vara abstrakta be- 
grepp som likaväl kan uttryckas genom ett adverb, som t ex 'med frenesi'', 
'frenetiskt'. 

Skillnaden mellan Schanks instrumentella kasus och vårt adverbial kan 
sägas vara att instrumentet finns implicit i verbet, medan adverbial-et ko- 
das hos oss,om det finns explicit som modifierare till handlingen. Tyvärr 
diskuterar Schank inte adverbial (AA), vilket borde ha varit på sin plats 
här. Därmed är vi inne på frågan om de conceptuellt nödvändiga delarna 
på lämpligaste sätt kan kodas. Här skall därför redogöras för hur vi an- 
ser att begreppsnivån kan göras explicit för vårt syfte." 

Det naturliga språket som informationsmedel kännetecknas av en eko- 
nomi, som bl a innebär att referens uttrycks med pronomen. Ruta 7 vi- 
sade hur vi kodar ett personligt pronomen med referenten inom parentes. 
Det finns även andra sätt att uttrycka en till innehållet fullständig mening 
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utan att alla nödvändiga delar är explicita. I ett samtal mellan två personer 
t ex behöver inte alla delar vara med, eftersom de i sammanhanget är kän- 
da för mottagaren av meddelandet. Principen kan visas med detta enkla 
fråga -svar -exempel: A: '"Vill du ha det stora eller det lilla äpplet?' B: 

Det lilla.' Vad B menar är: 'Jag vill ha det lilla äpplet/ överfört på den 
tidigare diskuterade teorin om beroenden innebär kodningen av B;s svar att 
vi för det första kodar svaret som ett beroende begrepp (PA) som tillhör 
det oberoende (PP) 'äpplet'. Dessutom ligger i svaret den syntaktiska funk- 
tionen objekt (< } och det räcker inte som conceptualisering. Verbet är 

'vill ha' (vi måste utgå' från det som tidigare sagts och inte vad B eventuellt 
hade sagt i stället). Men 'vill ha' + objekt (ACT< PP) är heller inte till- 
räckligt; agent (eller subjekt) 'jag' fattas. 

Det som vi här har kallat vertikalt beroende gäller utfyllnaden av be- 
greppskomplex, så att huvudord görs explicit i kodningen. Om huvudordet 
är det begrepp som sägs kan vi betrakta begreppskomplexet som självstän- 
digt, men i de fall attribut eller bestämningar står ensamma i satsen supp- 
lerar vi in det begrepp som är det självständiga och som återfinns i den 
föregående kontexten. Det kan också finnas fall där det begrepp som är hu- 
vudord inte tillräckligt förklarar hela komplexet, t ex 'lärarhögskolan'. Vi 
kan här utgå från ändeisen, den bestämda formen. Begreppet måste då 
ytterligare bestämmas, t ex 'i Malmö', som då är en efterställd bestäm- 
ning med siffran 3 som andra siffra i koden. Vi har utarbetat regler för 
hur våra suppleringar skall göras (I. Bierschenk, 1974), men de är ännu 
inte fullständiga. 

Vi skulle kunna kalla det beroende som uttrycks genom oberoende be- 
grepps förhållande till varandra i en sats som horisontellt beroende. Lik- 
som Schank utgår vi från verbet som det centrala begreppet i en sats. Ver- 
bets "riktning" avgör vilken kod de involverade huvudorden får. Det be- 
tyder att vi inte kan göra en syntaktisk kodning, där det första huvudordet 
(PP) är subjekt oavsett innebörden. Vårt paradigm A a O är vägledande och 
det PP som är agent behöver inte alltid vara satsens subjekt. Vi beteck- 
nar det substantiv som är styrande som agent, oavsett om det är abstrakt 
eller konkret. Det betyder samtidigt att vi inte i förväg anger om verbet 
är ett handlingsverb eller ett tillståndsverb. Däremot skiljer vi på kopu- 
la-verb och andra verb och därmed har vi gjort en distinktion mellan sub- 
stantiv som utför handling eller befinner sig i ett tillstånd och de som är 
föremål för värdering eller klassificering från talarens sida. Bestämning 
av verbens aktivitets gr ad sker genom skaleringen och först därefter hop- 
pas vi kunna bilda kategorier av verb. Med ledning av dessa resultat blir 
det också möjligt att gruppera substantiven enligt en innehållsteori på 
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empirisk grund. Vi innehållsbe stämmer alltså inte våra koder mer än till 
den conceptuella funktionen och den liknar mycket Schanks kasusteori som 
bygger på syntaktisk roll. 

Hur viktigt verbet är som nyckel till hur övriga begrepp skall kodas 

illustreras i ruta 9. 

i 

Ruta 9. Kodning a.v riktning vid passiv verbform 



DET HÄR (X) 
: HAR 

: JU 

! ALDRIG 

| UNDERSÖKTS 

! FÖRUT 



50 
40 
42 

40 
43 



Kod -- betecknar negation 



Har undersökt' är den aktiva formen. Agent till verbet saknas och är här så 
pass odefinierad (ev 'av forskare') att den inte har supplerats in. Däremot 
är det klart att objektet är X och att detta inte kan vara agent. Verbets 
passiva form gör det omöjligt. 

Agentlösa satser med passivt verb är tämligen vanliga, när talaren 
inte anser att agenten är väsentlig i sammanhanget. Den finns heller inte i 
kontexten. Vårt paradigm är inte uppfyllt här, men meningen kodas ändå. 
Vi har ansett det viktigt att så mycket text som möjligt läggs in och vi kan 
då i efterhand arbeta med de olika slagen av satser. Den information vi vill 
ha avgörs genom de kopplingar av begrepp som är tillgängliga. Verbet av- 
gör således om paradigmet kan kodas i sin helhet eller inte. I detta fall är 
formen indicium. I andra fall beror kodningen på betydelsen i verbet. I 
ruta 10 visas två typer av verb, där det ena "fordrar" en supplering av 
det begrepp vi kallat mål, dvs som motsvarar Schanks kasus recipient, 
och det andra är en typ av verbbegrepp, vars huvudkon stituent egentligen 
är ett substantiv. 

Ruta i . Kodning av det fullständiga paradigmet 



I 

i 



VI (XYZ- PROJEKTET) 30 

SKICKADE IN 40 

EN PROJEKTANSÖKAN 50 
(TILL _RIKSB ANKSFONDJEN) _ _ _70_ 

JAG 30 

VAR HANDLEDARE FÖR 40 

LÄRARKANDIDATER 50 

PÄ ÄMNESLÄRARLINJEN 53 



I verbet 'skicka' ligger implicit ett mål eller en mottagare. När detta begrepp 
är känt i texten supplerar vi det så att en fullständig conceptualisering bil- 
das. Det andra exemplet ges här som en illustration till att vi inte gör en 
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fullständig syntaktisk analys, En sådan skulle nämligen inte ha betraktat 
'handledare' som verb och förbindelsen mellan 'jag' och 'lärarkandidater' 
skulle inte ha framträtt. Vi ser 'var handledare för' som ett verb motsva- 
rande 'handleda', till vilket det måste finnas ett objekt. Däremot finns här 
inget mål för handlingen handleda, som inte uttrycker riktning. (På vilket 
sätt vi definierar verb framgår av I. Bierschenk, 1974, s 57 och 1975, 
ss 8-9. ) 

5. 3 Representation och kodning av relati oner 

I kapitel 5. 2 har diskuterats förhållandet mellan beroende och oberoende be 
grepp och i vilket förhållande sådana begreppskomplex står till varandra i 
en fullständig conceptualisering. En fullständig conceptualisering kan 
emellertid i sin tur relateras till en annan, och detta förhållande motsva- 
ras av satsfogning. Förhållandet mellan concepts kallas beroende ("depen- 
dency"), medan förhållandet mellan c onceptualise ringar kallas relation. 

Den viktigaste conceptuella relationen är enligt Schank (s 202) den som 
uttrycker kausalitet, vilket anges symboliskt: 

<:;::;::.^ < — ---> 
Regel 11 a. f]t n b . <j> . > 



../ 



Kausaliteten uttrycks genom pilen mellan de båda satserna. (Skall ej upp- 
fattas som logikens tecken för implikation. ) Schank tar några exempel på 

hur kausalitet får sitt uttryck i engelskan: 



John was sad because Mary hit him. 
When Fred gave Mary a peach she ate it. 



P o 

Mary <=-=$ hit < — John 

John Jk^ Sad 

P ' o R A Mary 

Fred<~rrni träns* — peach 



John killed hi s teacher 



Ma ry (. ... ."•■ inge st < 

P 
P 
John < -' ■ ■■■ ) do 

ii p^ dead 

teacher 4^~~ 
P 
' — <älive 



[.Fred 



peach 



POSS-BY 

John 

1T.NGEST är en kategori av ACT liksom TRÄNS.) 

I verbet 'döda' ligger betydelsen av tillståndsförändring som leder till ett 
resultat enligt regel 10 (se sid 36). Handlingen i 'kill' skulle kunna vara 
by shooting', som då realiseras som t ex 'propel hullets via a gun to the 
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teacher's head'. 'Döda' är alltså en klass av transitiva verb som Schank 
kallar "pseudo-state-verbs". De har egenskapen att verbets objekt är 
'actor' i den beroende conceptualiseringen (läraren dör). Ofta är verbet 
ACT i den beroende satsen, 

Sam flew his plane to San Francisco'' skulle tydas 'Sam gjorde så att 
hans plan flög honom till S. F / Det är alltså ett slags g ömd kau sal itet , som 
också diskuteras i exemplet 'John comforted Mary', där John orsakar ett 
tillstånd hos Mary (regel 10), Regel 10 har redan avfärdats som irrelevant 
för oss och det tredje exemplet ovan lämnas därhän i den fortsatta jämförel- 
sen. 

Regel 11 skall nedan jämföras med ANACONDAS kodningsregler. 

Med utgångspunkt i ovanstående exempel på kausalitet, bör man ställa 
frågan: Vad menas här med kausalitet? Splittringen av regel 11 i a och b 
gör det möjligt att förklara detta som ett mer generellt fenomen än att re- 
lationen skulle gälla sådana satser som traditionellt skulle analyseras som 
orsakssatser. Kausalitet uttrycker relation mellan satser, där två (eller 
flera) handlingar åtskiljs i tiden, Schank (19?3, s 205) säger: 

"In other words, we want to be sure to distinguish distinct conceptual events 
in the real world. " 

Det första exemplet skulle analyseras som en mening med en orsakssats 
inledd med 'because' (på svenska 'eftersom'', 'på grund av', m fl). Den 
andra meningen uttrycker snarare en förutsättning, där första satsen i ti- 
den ligger före den andra. Sambandet ligger i att Mary åt persikan efter att 
ha fått den. Det tredje exemplet uttrycker en "dold "orsak, som beror på 
betydelsen i verbet. 

I ANA CONDA- systemet finns varje sats kodad för sig inom sin mening, 
på så sätt att satserna tar var sina två kolumner i anspråk. Vad som är 
sats avgörs alltså genom hur många verb meningen har, vilket är detsam- 
ma som en åtskillnad mellan "distinct conceptual events". Relationer mel- 
lan satser uttrycks inte bara genom en viss ordningsföljd eller ett visst 
antal, utan också genom det tema som hela meningen kodas enligt. Tema- 
koder återfinns före texten, i anslutning till identifikationskoderna och be- 
traktas alltså som överordnade begreppskoder. Ett tema gäller inte något 
enskilt begrepp, utan kodas genomgående till varje begrepp. Vi har då 
möjlighet att genom en kod i början av kortet sortera ett begrepp som till- 
hörigt ett specifikt tema. Var på blanketten temakoderna finns illustrera- 
des i figur 1. På vilket sätt Schanks två första exempel kan kodas presen- 
teras i figur 3. 

De koder som kan förekomma i temakolumnerna (15-23) är antingen 
1 eller 2. 1 betyder att satsen kommer före i tiden i förhållande till den 
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I kolumn 15 kodas villkor 20 

16 orsak 21 

17 medgivande 22 

18 följd/avsikt 23 

19 disjunktion 

Figur 3. Kodning av relationer 



\ 

komparation 
fråga 
antagande 
önskan 



andra satsen. Den syntaktiska följden bibehålls. Satskodningen visar hur 
satser löper i slingor. För detta system redogörs utförligt under figur 4. 
En siffra efter begreppskoden visar i vilken kolumn meningen fortsätter. 
Både "eftersom' och 'när' anger ny sats och kallas för satsinledare, som 
oftast är ett adverbial; därav beroende kod till verbet. När stansning sker 
upprepas koden i temakolumnerna tills dess att den bryts av ny kod (gäller 
ej vid meningsslut). Kod 46 som satsinledare är indikator på någon form av 
relation som inte binder ihop enskilda begrepp utan hela satser. Schank 
(1973, s 206) uttrycker detta genom: 
"A relation is used to reläte dependencies not concepts. " 

Tolkningen av den första satsen är enkel , eftersom orsakssambandet 
uttrycks explicit, så det behöver inte närmare diskuteras. Den andra me- 
ningen kan däremot vara svårare. Den är inte lika entydig. Tolkningen i 
figuren innebär att meningen anger en handling som får en följd i en ny 
handling. Parentetiskt bör nämnas här att följd och avsikt har sammansla- 
gits. Det är ganska svårt att i talspråkstext skilja på "så att . . . ' och 'för 
att . . . ' - satser. Oftast uttrycks båda innebörderna med en så -konstruktion. 
I den här kodade meningen antas antingen att Fred hade för avsikt att Mary 
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skulle äta äpplet eller att Mary åt äpplet som en följd av att hon fick det 
(Han gav det sä att hon skulle kunna .„.},. Det hade också funnits en annan 
möjlighet att koda den meningen, nämligen att se den första satsen som en 
tidsbisats. I stället för 46 hade da 'när' fått 43. som uttrycker tidsadver- 
bial, men temakod hade slopats. Det är i sådana fall som utbrytningen i 
satskolumner är till hjälp vid återvinningen. Huvudsatsen är den första, i 
det här fallet med ett fullständigt paradigm (30 + 40 -i- 50), Förutom para- 
digmet finns begrepp som uttrycker omständigheter av olika slag runt hand- 
lingen. Handlingen i denna bisats är 'gav' och denna handling måste vara 
före i tiden, vilket är sådana bisatsers karaktär. Ett annat indicium är 
ordföljden i huvudsatsen. Till identifikationen hör ordningsföljden bland be- 
greppen. Om kod 40 står före kod 30, kan vi prediciera att en bisats kom- 
mer före, om det inte finns temakod för fråga. Är däremot ordföljden i 
huvudsatsen den omvända, går det inte att göra en sådan prediktion, utan 
då får vi använda koden 43. Problemet med denna typ av relation behöver 
inte vara så stort. Antingen vi kodar satstema eller har explicit en tids- 
angivare framträder relationen; i bägge fallen gäller det ju handlingars 
tidsaspekt. Exemplet visar dock att det finns många omständigheter att 
ta ställning till vid utvecklingen av ett datorbaserat system för innehålls- 
analys. Paradigmet A a Ö skulle ensamt vara otillräckligt när det gäller 
kodning av satsrelationer. 

Vi har således koder för sådana aspekter i en mening som inte kommer 
till uttryck genom vårt paradigm. Vilka dessa aspekter är redogörs för 
närmare i den fortsatta jämföreisen. 

I figur 1 anges plats på blanketten för sådana modifieringar som gäller 
verbets aspekter. I figur 3 är tempus kodat i kolumn 13 och modus i kolumn 
14. Schank (1973, ss Z06-207) säger: 

M Any conceptualization can be modified by certain conceptual ten ses of 

which 'p '' for past is one . , . 

. . . These tenses modify a. conceptualization as a whole. " 

På samma sätt som vi kodar tema enligt innebörden i sats relationer , kodar 
vi tempus och modus med utgångspunkt i verbet. Schank exemplifierar be- 
tydelsen av att särskilja relationer från de "conceptual tenses" som ligger i 

ACT genom meningen: 'Since smoking can kill you, I stopped.' 
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Den conceptuella representationen är 



one£r$INGEST <- 



emoke 
I 



B, 






one 



< cigarette 



one 



Y' ' — * ■' 






c 



de ad 



I 



tF 



^Llive 



INGEST 

T 

smoke 
R 



one 



cigarette 
(c ~ conditional, t^ = finished trän sition) 

Vad som uttrycks på detta sätt är i den översta satsen: 'man röker' 
('smoking'), den underliggande till den: 'man kan bli död (orn man röker)'' 
och den tredje under 'smoke' säger: 'jag slutade röka' . Schank kommen- 
terar förhållandet mellan dessa tre conceptualiseringar så här: 

"This sentence contains two conceptualizations related by a causal and a 
causal relating that causal to a third conceptualization. Such a thing is 
nearly impossible to handle in more traditional linguistic representations. " 

Detta sista påstående kan inte få stå odiskuterat, så vi skall försöka ana- 
lysera relationerna enligt ANACONDA- systemet. 

De tre conceptualiseringarna 'man röker', ' man kan bli död' och 
'jag slutade röka'- kan uttryckas genom kodning på datablankett i tre ko- 
lumner, som figur 4 visar i det översta exemplet. I Schanks C-diagram 
ligger en djupare conceptualisering i 'rökning' än vad vi skulle ange. Här 
har vi för exemplifieringens skull uppdelat begreppet 'rökning' i de två 
nödvändiga begreppen för en sats. Den andra satsen säger samma sak 
som Schanks regel 10, alltså förändring av tillstånd från levande tili död. 

Den kunde också ha uttryckts via 30 + 40, dvs ' man kan dö', utan att inne- 
börden hade förändrats. 'Bli' står i vårt fall för "change of state" och re- 
sultatet är 'död', som är en beskrivning av actor, således ett beroende be- 
grepp (32). Varianten 30 + 40 innebär ingen skillnad, eftersom den handling 
som ligger i 'dö' har n sig själv" som resultat. Den tredje satsen har gjorts 
fullständig genom supplering av den handling som antytts genom verbet 
'sluta'. Vi har samma regel här som Schank (1973, s 207) uttrycker med 
orden: 

"The English word 'stop' for example is actuaily an instance of the con- 
ceptual tense 'tp,' and thus predicts an ACT. That ACT was unstated ..." 

I fråga om tempus har vi inte gjort alla de distinktioner som vore möjliga, 

t ex början av handling, fortgående handling, avslutande handling, etc. 

Börja, bruka, sluta osv kodas som verb och tillhör hela verbbegreppet. I 

exemplet är dessa delade men hör ihop genom samma kod. Ett program 

finns som sammanför verben till en sträng för vidare bearbetning. De 
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Figur 4, Kodning av relationer: Modifiering 




ovannämnda nyanserna har vi ännu inte tagit ställning till, men det är fullt 
möjligt att göra en innehållsbestämning i efterhand, när vi har tillräckligt 
många exempel på hjälpverb eller ofullständiga verb; de skulle då kunna 
specificeras i kodnings reglerna, Tempus kodas i kolumn 13 med kod 1 för 
presens, 2 för förfluten tid och 3 för futururn. Om i kolumnerna 13 och 14 
står (som i vårt exempel) kod 1+4 betyder detta "för talaren närvarande 
tid, modalt" och 2+1 uttyds "för talaren förfluten tid, faktiskt". 

Relationen mellan de två första satserna i den översta meningen måste 
kunna framträda. Schanks c i diagrammet vidden beroende pilen anger 
'conditional*'. Vi har angivit denna relation med ett 'om' (motsvarande ''if"). 
Ett sådant 'om' blir satsinledare (vilket tidigare nämnts) och får kod 46. 
Denna relation borde enligt Schank vara en "causal", men på vilket sätt? 
' Man kan bli död om man röker' uttrycker ingen villkorsrelation. Vill- 
koret för att betrakta sig som död är inte att man varit rökare. Villkor 
måste uttryckas som ett verkligt förhållande. Orsaken till ens död är hel- 
ler inte rökning, men det kan vara det. Relationen är med andra ord ut- 
tryck för en korrelation, men bara för ett potentiellt orsakssamband. Vi 
kodar inget tema för just den relationen, men vi anger samband genom 
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kod 46. I stället uttrycker vi modalitet genom kod 4 i kolumn 14. Detta 
samband, den potentiella orsaken, hänger sedan ihop med att / jag slutade 
röka' . Satsinledare för detta är 'eftersom', som följdriktigt har kod 46. 
Innebörden i hela meningen skall tydas: ' Eftersom det finns ett potentiellt 
orsakssamband mellan rökning och död, slutade jag röka/ Detta är orsa- 
ken till att jag slutade röka och detta senare orsakssamband måste uttryc- 
kas genom en temakod, nämligen i kolumn 16. Att jag slutade röka är en 
följd (2) av att jag har funderat över riskerna (1). 

Av framställningen har det förhoppningsvis framgått att kod 46 pekar 
mot en sats, framåt eller bakåt. Detta anges med siffra för respektive 
sats ordningsföljd i meningen, I dator går läsningsprocessen till så att 
varje begrepp (kort) läses för sig i den ordningsföljd de står. Det kan nu 
vara så,att vi i våra analyser vill arbeta med de enskilda begreppen utan 
identifikation, tema eller plats i meningen, genom kopplingar av begrepp. 
Loop-koden är till för att begreppskoderna inte skall "hänga i luften". För 
att exemplifiera loop-koden kan vi göra följande sökning. Vi vill veta hur 
olika verb står i förhållande till varandra (vi räknar 41 + 32 som tillstånds- 
verb) och maskinen samlar tre verb ur denna mening i den följd de står. 
Några andra begrepp har vi inte att gå efter. Det första verbet är kodat i 
kolumnerna 7 2 och 73, vilket framgår av utskriften (kortbilden). Då und- 
rar vi: Hur hänger verben ihop? Maskinen får en instruktion i kolumn 74, 
som säger "gå till den andra satsen". Där träffar den på kod 46. I den sat- 
sen finns det andra verbet. Då kan vi sluta oss till att det andra verbet är 
överordnat det första. Efter det andra kommer det en instruktion att gå till 
sats nr 1. Där ger en ny kod 46 ett samband med det tredje verbet. Utan 
att "veta" meningstillhörighet kan datorn på detta sätt gruppera begrepp 
som bildar en struktur. 

Nu går vi tillbaka till det exempel som Schank utgick ifrån: Since 
smoking can kill you, I stopped/ 'Smoking' var detsamma som 'man rö- 
ker'. Det första exemplets tredje sats dras alltså ihop till ett begrepp 'rök- 
ning'. Då är vi över i sats två genom looping. 'Kan bli död' var detsamma 
som 'kan dö'. Hur hänger man kan dö' ihop med 'rökning'? Jo, looping 
säger att det kan finnas ett orsakssamband: 'man kan dö på grund av rökning', 
alltså 'rökning kan döda en'. Exempel 2 i figur 4 uttrycker detta. Vi ser 
då begreppet 'rökning' som agent och 'man' som offret ('en' = objektsform). 
Ingenting i conceptualiseringen har egentligen förändrats; temakodningen 
är densamma. Som det sista exemplet visar skulle ANACONDA ha repre- 
senterat meningen. Att rökning innebär 'man inhalerar rök genom att en 
cigarrett (eller hellre rökverk) transporterar röken från sig själv till 
'man' anser vi oss inte behöva koda. Hur man i ett lexikon skall specifi- 
cera begreppet rökning semantiskt är en långt senare fråga. 
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Här har vi försökt visa att ANACONDA, trots sitt relativt enkelt upp- 
byggda kod system, ändå kan handha komplexa relationer. Ett påpekande 
återstår dock att göra till de här diskuterade kodningarna. Vi får inte 
fram det faktum, som ligger implicit i 'jag slutade röka', nämligen 'jag 
rökte (eller har rökt)', vilket alltså innebär att jag har 'börjat röka och 
fortgående hållit på att röka, samt gjort det med vissa mellanrum'. Men 
det gör å andra sidan inte Schank heller. 

De andra conceptuella relationerna enligt Schank är tid ("time") och plats 
("location"). Två regler symboliserar tidsrelation., där den ena avser ett be- 
grepp och den andra anger att en conceptualisering är en tidsaspekt av en 
annan conceptualisering. Den tredje indikerar att en händelse måste äga 
rum någonstans. I ruta 11 symboliseras dessa tre regler tillsammans med 
motsvarande ANACONDA -koder. 

Ruta 11. Jämförelse mellan C-diagrarn och ANACONDA: 
Tids- och platsrelationer 



C-diagram 




ANACONDA 


Regel 12. 

f 

Regel 13. 

i 

i Regel 14. 


T 

. 4'- 


43 

43 (+ loop + sats) 

44 

| 




\ 1 

PP 

ii 



"T" i regel 12 står för ett tidsbegrepp, som t ex 'i går' 'klockan 12'. Be- 
greppet relateras till en hel conceptualisering. Schank (1973, s 207) menar: 

"The time of something modifies the entire conceptualization and not any 
parti cular item in it. " 

Liksom i fallet med plats refererar tid inte till ACT, såsom ett kasus, 
som måste finnas explicit till vissa verb. Vi har av praktiska skäl anpas- 
sat dessa koder till traditionella beteckningar av dessa begrepp, nämligen 
tids- och rumsadverbial, som är lättast att känna igen vid satsanalys. Ko- 
derna anger därför ett beroende till verbet. Efter som verbet är det cen- 
trala i en conceptualisering är detta den lämpligaste kodbeteckningen, ifall 
man inte vill skapa ytterligare koder med ny första siffra. 

Regel 13 förklaras med exemplet While going home I saw a frog , 
som representeras 
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Tecknet för tid uttrycker två handlingar, som egentligen är svåra att sär- 
skilja i tiden, så att den ena föregår den andra (jfr diskussionen till fig 3), 
Den översta meningen uttrycker tid, innefattande en riktnings mål, och den 

undre betecknar handlingen. Tidssatsen skulle kunna dras ihop till 'på hem- 
vägen'. Tidsadverbet är i det här fallet på svenska 'medan', 'under tiden 
som' och inte 'när'. Vår kodning enligt regel 12 och 13 visas i figur 5, 
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Figur 5. Kodning av tidsbegrepp och -relation 

Det översta exemplet är kodat enligt regel 13 och följer Schanks represen- 
tation, I regel 12 (ruta 11 ) ser vi att pilen för tid inte är dubbel, dvs inte 
skulle innehålla ett PP. Vårt 'hemväg' skulle heller inte kunna tolkas som 
en konkret väg genom koden för tid, så därför skulle det inte innebära nå- 
gon risk att dra ihop satsen till ett begrepp. 

Regel 14 är av intresse, eftersom det finns olika slag av platsbestäm- 
ning. Denna regel avser inte sådan bestämning som är beroende till ett 
PP (enligt regel 5, ruta 5). Schank ger ett intressant exempel på dessa 
skillnader och det skall återges här med ANACONDA:s kodning i direkt 
anslutning. Meningen lyder; 

'Yesterday, the boy in that chair hit the boy on the piano in the mouth in 
the park,' 

Vi ser av figur 6 att de båda LOC är beroende PP och de kodas med ver- 
tikal beroendekod (33, 53). 'Park' anges mellan agenten och handlingen 
och kan därför ses som beroende till den händelse som utspelades; 'i par- 
ken' kodas med 44. Så långt är meningen enkel att dela upp på vårt sätt. 
Anledningen till att exemplet är intressant är kodningen av 'på munnen', 
som trots prepositionen inte kan tydas som platsbestämning av något slag. 
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Figur 6. Teoretisk och praktisk representation av lokalitetsbegrepp 

Som Schank anger är pojke nr 2 ägare av munnen som pojke nr 1 slog på. 
Då skall 'munnen' kodas som huvudord och 'pojken' som bestämning i ge- 
nitiv, enligt vårt första förslag, Hela begreppskomplexet uttyds då 'poj- 
kens på pianot mun', vilket torde vara det rätta. Men egentligen säger vår 
kodning inte exakt det. Kod 53 skall vara en utfyllnad till huvudordet i kom- 
plexet och då skulle vi få 'på munnen på pianot'. I sådana fall blir en sök- 
ning utvidgad så att när kopplingen mellan två begrepp inte är semantiskt 
meningsfull utvidgas sökningen till att gälla även kod 51 , där beroendeför- 
hållandet framträder. Det andra exemplet innebär att vi inte anser 'mun- 
nen' vara huvudsaken, utan att hela pojken blev slagen. Var slaget träf- 
fade är då en upplysning som har med handlingen att göra, dvs handlingen 
i 'slog' är 'rörde häftigt handen (?), så att den träffade munnen' och är det 
sätt på vilket det hela gick till, således kod 45. En tredje möjlighet anges 
med /O och som skall förstås så att vi t o m kan tänka oss att ange hela 
handlingen (40 + 50) som ACT, dvs kod 40, som då ses som det idiomliknan- 
de uttrycket 'slog på käften', där 'käften' inte alls skall förstås bokstav- 
ligt. De två sista alternativen tas upp här för att visa kodsystemets plasti- 
citet. Den första kodningen är troligtvis den mest adekvata och följer 
Schanks modell. 
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Regel Ila och b skulle kunna vara uttryck för ett horisontellt beroende, 
eftersom de uttrycker att två conceptualiseringar har ett orsaks- eller an- 
nat samband med varandra på tidsplanet, så att den ena i tiden förutsätter 
den andra. Dessa relationer kodas i vårt system med 46 + loop samt med 
tema som anger vilket slag av bisats meningen innehåller. Bisatsen kan 
vara konditional, kausal, koncessiv, konsekutiv eller final (kolumnerna 15- 
18). (De två sista har sammans lagits , se sid 42. } 

Vertikalt beroende anges med de relationer som ligger utanför para- 
digmei, således tid och plats, enligt reglerna 12-14, där regel 12 och 13 
betraktas som likvärdiga, Den vertikala aspekten i dessa relationer skulle 
kunna försvaras med att de dels inte kodas som övergripande tema utan 
som begrepp och dels har beroende kod till den händelse som meningen om- 
talar, representerad genom verbet. 

Denna uppdelning bör dock ses som preliminär, men kan vara till 
hjälp när vi utarbetar de slutliga kodnings regi erna. 

Den jämförelse som har gjorts här har utgått från Schanks presenta- 
tion. Flera relationer skulle kunna diskuteras, men lämnas åt sidan i 
detta sammanhang. Vad vi här har försökt visa i kapitel 5 är på vilket <sätt 
en teori om språk i form av symboler och bakomliggande tankestrukturer 
kan representeras i form av siffror för input i dator. Grundläggande är 
de 14 reglerna för begrepp och relationer. I sin fortsatta framställning 
går Schank över på semantiska spörsmål ("conceptual semantics"). Vi är 
ännu inte beredda att gå in på en jämförelse därvidlag av det skälet att vi 
baserar "innehållet" i begreppen på en empirisk utprövning (se kap 3. 4), 
där de statistiska analyserna inte är färdiga. 
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6. ANALYS AV TANKES TRUKTURER 

I diskussionen om General Inquirer framhölls vikten av att bygga upp lexi- 
kon på grundval av en språkteori. Målet med den teori om språk som vi 
följer är endast en representation av språkstruktur. Det har framgått att 
vi inte alltid anser oss behöva koda texten, eller representera alla under- 
liggande conceptualise ringar. Det beror dels på att vår manuella bearbet- 
ning av texten skulle bli för tidsödande och kanske också innebära svårig- 
heter vid samstämmighet bland flera kodare, som är en viktig faktor när 
man skall handha stora mängder av text. Dels och främst beror det på att 
alla underliggande strukturer inte är nödvändiga för vårt syfte, för den in- 
formation vi Önskar få ut ur materialet. En teori för kodning av verbala 
data måste anpassas till en teori om den "värld" som dessa data är en re- 
presentation av, i vårt fall pedagogiska forskares syn på sin egen värld. 
Denna värld ses som ett system av värderingar och kunskap, vilket bestäm- 
mer vilka handlingar den enskilde utför. 

Sedd i detta perspektiv ansluter sig vår analys till kognitionspsykolo- 
gisk forskning. Inom ramen för denna forskningsgren har Abelson (1973) 
utvecklat en modell för analys av "belief systems" (belief = ungefär för- 
santhållande, övertygelse). I "The structure of belief systems" anger Abel- 
son förutsättningarna för utvecklingen av en "ideologimaskin", en simulator, 
som konstruerar möjliga politiska syften, planer, aktioner och tillstånd 
(t ex i "det kalla kriget") med utgångspunkt i samspelet mellan olika poli- 
tiska övertygelse system. Många av Abel sons idéer har varit betydande 
för GI utveckling. Detta är ett skäl till att Abelson även för oss fått stor 
betydelse. En väsentligare orsak är emellertid att hans framställning 
(Abelson, 1973) grundas på Schanks språkteori i modifierad form samt att 
hans modell för analys har en målsättning som i många stycken liknar vår. 
Den följande framställningen skall därför presentera Abel sons system och 
diskutera dess relevans för ANACONDA. 

6. 1 Teoretisk ram 



Inledningsvis anför Abelson (1973, s 293) följande: 

"In the process, we make extended use o£ Schank''s Conceptual Dependency 
Analysis. ... It is essential in giving firm conceptual grounding at the 
level of event detail. But our emphasis is different from Schahk/s in that 
we are oriented more toward the relationships between conceptual dep en - 
dencies than toward representations within conceptual dependencies. Con- 
sequently, our notation is occasionally at variance with Schank's, mainly 
in the service of convenience rather than because of theoretical disagree- 
ment. " 

Därefter nämns några skillnader, som avser djupet i representationen, 

där det för oss väsentliga ställningstagandet gäller vissa verb. Vi har 
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redan nämnt att Schanks regel 10 inte är relevant, eftersom den innebär 

kodning av ett resultat som ligger implicit i verbet. Abelson (1973, s 294) 

exemplifierar en av skillnaderna med verbet 'want': 

"We emphasize the directed activity to which a 'want' can give rise, rather 
than the state of pleasure which ensues from a satis fied 'want''. " 

Meningen I want a book' skulle analyseras olika hos Schank och Abelson. 

Jämförelsen görs i ruta 12 tillsammans med vår kodning. 

Ruta 12. Jämförande analys av verbet 'want' 



Schank 



one { cf ) PTRANS ^— — 



ié 



f 



- book ^_ 



R 



ci 



C 



I 

one 



•Åplea 



sed 



(cf = condition future , PTRANS = physical träns) 
Meningen uttyds: Om någon ger mig en bok, blir jag nöjd 

Abelson E^zzi^want 

t 
E £=^ po ss book 

(E = ego) 
Meningen uttyds: Jag önskar (vill) att jag har en bok 

ANACONDA Jag 30 

vill ha 40 

en bok 50 

(+ kod i kol 14 för modalt verb, i kol 23 för önskan) 



Som ruta 1 2 visar är den huvudsakliga betydelsen av verbet 'want' hos 
Schank det tillstånd som uppfyllandet av önskningen ger. Abelson däremot 
anger att målet för önskningen är att komma i besittning av boken. 

överhuvudtaget finns det ett problem med sådana här jämförelser. De 
exempel som ges är inte satta i ett sa mmanhang , ' dv s man har inte kon- 
texten klar för sig. Detta faktum aktualiseras i exemplet på vår kodning 
här. Om meningen uttrycker att 'jag vill ha en bok för att det är lämpligt 
att ha en när jag ska göra det här', är detta inte samma sak som 'jag öns- 
kar att jag hade en bok (eftersom jag inte har någon alls)'. I det första fal- 
let anger vi ingenting i kolumn 23. ^Önskan' 1 gäller när det är någonting 
man önskar få eller uppnå, som man hittills inte har. Våra regler ger så- 
ledes utrymme för båda tolkningarna av 'want': 'brukar vilja ha' och 
'skulle vilja uppnå'. Vi ansluter oss dock närmast till Abelson, eftersom 
'ha' är huvudsaken. 

Det finns både likheter och skillnader mellan Abelsons föreslagna sy- 
stem och vårt och det har varit intressant att ta del av de strukturer som 
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Abelson föreslår finnas i ett t! belief system". Denna hierarki presenteras 
nedan och därefter följer en exemplifiering av de olika begreppen. 

Abelson (1973, ss 294-295) diskuterar med utgångspunkt i följande 
nivåer: 



1 . Element. 



2. Atomer. 



3. Molekyler. 



4. Planer. 



5. Teman. 



6. Scripts . 



De minsta enheterna, 
basen i ett lexikon 

Enkla strukturer av element, 
som länkas ihop i ett C- dia gram 

Tre typer av atomer föreslås: 

P för syfte eller förutsättning ("purpose") 

A för handling ("action") 

S för tillstånd" ("state") 

Länkar av P, A och S-atomer \ 
P-A, A-S, P-S-par 

En molekyl anger en handling som utförs 
av en actor med syftet att uppnå ett 
speciellt slutligt tillstånd (resultat) 

Molekyler med mer än tre atomer, 
arrangerade i kedjor eller andra nätverk 
enligt specificerade regler. En plan innefattar 
det faktum att uppnåendet av ett syfte ofta 
fordrar en serie sekventiella och/eller 
parallella handlingar 

Två skilda actors beroende molekyler eller planer. 
Actors kan spela olika roller i varandras planer; 
de kan ha positiva eller negativa attityder mot 
varandras planer och de kan ha eller har inte in- 
flytande över dem. Kombinationer av sådana möjlig- 
heter ger upphov till en taxonomi av teman. 

Sekvens av teman som involverar samma slag av 
actors, med förändring i beroenden ("interdependencies") 
från ett tema till ett annat; utveckling av en 
"story" av möjliga förändringar i relationer mel- 
lan actors. 



6. 2 Kodnings reglers tillämpning i en hierarkisk struktur 

De elementstrukturer som Abelson kallar atomer motsvarar vad Schank 
kallar conceptualization, där elementen motsvaras av begrepp. De består 
alltså av actor, action och de "kasus" som är nödvändiga för att specificera 
handlingen. Abelson (1973, ss 295-297) gör en indelning av atomerna i tre 
typer, vilka symboliskt presenteras på följande sätt (ss 295-297): 

E 
one 



A (action) atoms one ^råf träns % X •$-— — ~ { i 



C 



Meningen uttrycker att någon ger objektet X till Ego, som är recipient. 

Y anger möjligheten av att ett instrument är nödvändigt för transfereringen. 
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one< ( ,„> träns ^_ 



X <- 



D 



C i 



Detta diagram uttrycker "directional case", där ett objekt flyttas från plats 

a till plats (3. 

En mycket viktig handlingsatom i Abelsons system är den där hand- 
lingen är ett förslag frän en actor till en annan actor : 

E(br£ propose ^ offer, Q 

t 

F ( s action B 

Meningen uttyds: 'e föreslår genom ett erbjudande av något slag att F skall 
utföra handlingen B.' 

S (state) atoms E < ^=> happy 

E < *■ "^ poss (X) 

F C ±> agent (E; B) 

Genom de tre pilarna uttrycker Abelson (1973, s 296) ett tillståndsberoende, 
som är ett resultat hos en actor eller sak, antingen ensamt eller i relation 
till ett annat objekt eller sak. 'Agent" har särskild betydelse i detta system. 
När F accepterar förslaget av E att utföra handlingen B, blir F agent till E. 
Distinktionen mellan actor och agent är väsentlig i ett system, som skall 
spegla samspels strukturer med avseende på t ex sociala kontakter och 
politiska beroenden. 



P (purpose) atoms 



E j — r^>want 

T 
E {===«» poss (X) 

John^zr^want 

f 

Mary^s^ happy 

En P-atom uttrycker en önskan tillsammans med det tillstånd som önskas. 
Den nedre atomens actor behöver inte vara densamma som den övre ato- 
mens. 

A- och S-atomer kan vara förbundna med varandra om handlingen i 
A-atomen sägs vara orsaksrelaterad ("causal relation") till S-atomen. 
Abel son (1973, s 297) beskriver några typiska exempel, varav den s k 
"tautological causation" är den vanligaste: 






one^rrr^ träns ^_ 



X 



R 



— -» 



E 



.one 



E £=^ poss (X) 
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Denna bindning ("bond") skulle kunna översättas med: "Om någon överför 
X till E, så blir E ägare av X". En tautologisk orsak är således det till- 
stånd (S) som handlingen med nödvändighet resulterar i. Andra bindningar 
innebär naturliga konsekvenser av användningen av vissa objekt, där det 
enda villkoret för bindningen är att en handling har tillräcklig styrka eller 
kvantitet, t ex: 



one { ■ - y i nge st ^_ 



A 



whisky 

t 
large amount 



one< 



fS> drunk 



som skulle kunna översättas med: "Om man dricker en stor mängd whisky, 
så blir man full. " Sådana paradigmer kallas av Abelson "conceptual postu- 
lates". 

Det tredje exemplet är mer komplext och framställs så här: 



E £=±f pr opose ^ 
1 F « 




Ff==fr agent (E; B) 



/, 



Detta något komplicerade diagram ställer frågan: Vad är det som gör att 

F blir agent till E och utför handlmgen B, efter att E har föreslagit det till 

F med belöningen Q? Svaret kan enligt Abelson (1973, s 298) generellt 

vara detta: 

"... F will accept when the apparent positive value of Q to him is greater 
than the apparent negative value of performing behavior B. " 

Tre atomer, P, A, S bildar en molekyl när tre villkor är uppfyllda, 
ett mellan varje atompar: 

(PS). S-atomen är det tillstånd som förbindes med P-atomens önskan. 

(AS). A-atomen är relaterad till S-atomen och 

(PA). Actor i A-atomen är agent till Actor i P-atomen. 

Om molekylen som enhet säger Abel son (1973, s 299): 

"The molecular unit captures the idea of cui action undertaken in order to 
attain a goal desired by the sponsor of the action. It is the essential buil- 
ding block of all belief systems which find meaning in the purposeful ac- 
tivities of individuals, institutions, and governments - or even the animis- 
tic forces of nature or gods, " 

En molekyl kan representeras genom ett C-diagram: 

want 



M 



Agent, F£=$act / 

G^^^, condition 
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De tre horisontella linjerna (eller atomerna) representerar "motivation", 
"action" respektive "goal". De diagonala enkla, dubbla respektive fyllda 
pilarna anger "purpose", "agency" och "causation". "Actor" behöver inte 
vara densamma i de tre atomerna, men kan vara det. Flera möjligheter 
finns, t ex EEE, EEF ; EFE, EFF, EFG. 

En kedja av atomer som resulterar i en fullständig P-A-S molekyl kan 
representeras hierarkiskt: 



©< 



E 



^ want 



t 

E ^~==^ t relief ^- 



from 



headache 



E ^rrzz£ inge st 



E^====^. relief £ 



a spinn 



f 



irom 



headache 



( A) : 

[mj s dH^r-© 

Det innehåll som uttrycks i denna hierarki är ungefär: E vill bli av med 
sin huvudvärk. E äter aspirin. E blir av med huvudvärken. Detta är däre- 
mot inget vanligt sätt att formulera innehållet i denna molekyl, snarare ett 
ovanligt klumpigt sätt. Det låter bättre om man säger E ville bli av med 
sin huvudvärk, så han ät aspirin och så blev han av med den. Men i reali- 
teten, på den syntaktiska nivån, uttrycker man hellre denna innebörd på 
ett mera ekonomiskt sätt, t ex: 'För att E skulle bli av med sin huvudvärk 
åt han aspirin eller ' E åt aspirin (så att han skulle) för att bli av med sin 
huvudvärk eller ''Genom att äta aspirin blev E av med sin huvudvärk''. Att 
huvudvärken gick bort antas, eftersom ytterligare försök att bli. av med 
den inte sagts. S-atomen ligger alltså implicit i P-A -relationen. 

Efter denna genomgång av de grundläggande enheterna för Abelsons 
analys skall dessa diskuteras i förhållande till ANACONDA. 

Vi har ovan konstaterat att en atom motsvaras av en conceptualisering, 
alltså ett fullständigt ANACONDA- paradigm i form av en mening eller sats. 
En molekyl motsvaras i sin enklaste form (P-A-S) av relationer, dvs sat- 
ser som är beroende av varandra. 

De två först exemplifierade ator.-«*rna är likadana som de conceptua- 
liseringar vi redan presenterat kodningen av. Till det andra exemplet kan 
dock tilläggas att, eftersom vi ännu inte har skilt på plats och riktning, vi 
kodar dessa begrepp med kod 44 i båda fallen (30 -f 40 + .50 + 44 + 44). 
Liksom Schank diskuterar Abelson instrumentets roll. I fallet vid exem- 
plet ovan kan man tänka sig att handlingen utgörs av verbet 'skicka', som 
innefattar ett visst eller vissa instrument eller medel för handlingens ge- 
nomförande, t ex " per post'. Vissa förutsättningar måste vara uppfyllda 
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för att "transfer" kan genomföras, något som Abelson benämner "instru- 
mental control". Om instrumentet inte finns explicit, kodas det inte hos oss. 

Ägande, plats och innehåll ("possession", "location", "containment") 
som hos oss motsvaras av kodernas andra siffra i begreppskomplexet (31, 
33) är vanligtvis inte nödvändiga i Abel sons system. Till detta ansluter vi 
oss, eftersom vi i första hand arbetar med huvudbegrepp. 

Det tredje exemplet är också det första exemplet på hur uppbyggnaden 
av ett system grundar sig på en samhällsteori. Man måste hålla för sant 
att när flera personer är inblandade i ett händelseförlopp, vissa påverkar 
eller styr andra och det bildas beroenden mellan de involverade, ensidigt 
eller ömsesidigt. Frågan för oss i det här sammanhanget är tills vidare 
hur en sådan atom kan återspeglas i texten. 

I diagrammet till den tredje atomen uttrycks ingen or saks relation mel- 
lan E och F, dvs mellan handlingen "propose" och "action" B, bara att B 
är underordnad i tiden till den förra. Dessutom är E endast initiativtaga- 
ren och utför inte själv en handling som skall relateras till den senare. 
Enklast kan man uttrycka detta med E föreslog att F . . . . En att- sats 
betraktas som ett begrepp, bestående av flera begrepp, alltså E (30) före- 
slog (40) att . . . (50), som egentligen inte innebär något annat än en con- 
ceptualisering. De begrepp som. innefattas i att-satsen står samtliga i ob- 
jektsförhållande till verbet. Detta exemplifieras i figur 7. 













1 *&- 


::±: 








ib 


. .. \ f. 


jpifh-. 




9t> 


-i — r r 


__4-- 



Figur 7. Kodning av handlingsatomer: Att- satser 
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Handlingarna 'söka' respektive 'återlämna' följer i tiden efter 'uppmana' 
och 'kräva'. 'Jag' är i båda fallen ett objekt för professorns och bibliote- 
kets handlingar. Här framgår inte om 'jag' agerar enligt intentionerna. Vad 
som visas här är att det kunde vara möjligt att genom kodning av en enda 
mening få fram vad Abelson menar med "actor" och "agent". Här framgår 
det dock inte om agenten 'jag' verkligen utför handlingarna. Vad som åter- 
speglas i denna struktur är möjligen vem som är "actor", dvs överordnad 
och det anges med huvudsats . Vem som i realiteten är agent till vem av- 
speglas sällan inom en mening (eller atom). Det ligger förborgat inom ett 
helt "system" och bör diskuteras på en annan nivå, om diskussionen alls 
är möjlig för oss. 

När det gäller S-atomerna motsvaras den första av det vertikala bero- 
endet mellan begrepp, t ex 30 + 32, som har att göra med kopulaverb (eller 
predikatsfyllnad enligt traditionell satsanalys). 

Den andra som uttrycker ägande betyder inte detsamma som Schanks 
POSS eller vår kod 31. Som den efterföljande texten anger är S ett tillstånd 
som är en conceptualisering, dvs har något slag av verb som länk mellan 
minst två begrepp. I det här fallet skulle verbet vara 'ha' (äga). I den text 
som är kodad enligt vårt system har verbet 'ha' inte brutits ur de övriga 
verben, men det har diskuterats och det kan mycket väl göras i efterhand 
i och med att trunkeringar gjorts på samtliga verb. Vi kan alltså maski- 
nellt ta ut alla former av 'ha' och byta ut kod 40 mot en ny kod. Frågan är 
bara om detta är nödvändigt på kodnings stadiet. Det är riktigare att be- 
trakta verbet 'ha' som bärare av ett tillstånd, men det begrepp som följer 
är inte ett beroende (adjektiv) utan ett oberoende, så någon skillnad borde 
i så fall anges i kodningen av verbet. De olika verben skall dock i ett se- 
nare skede specificeras och kategoriseras och det torde finnas flera som 
bedöms vara av samma slag som 'ha' i fråga om Osgoods tre dimensioner, 
t ex s k statiska verb. Ett motiv för att ändå särskilja 'ha' från andra 
kunde vara den höga frekvensen det har. 

Liksom det slag av A-atom som diskuterades i ruta 1 2 kan den tredje 
S- atomen knappast i sin helhet diskuteras som en urskiljbar företeelse på 
det syntaktiska planet. Visserligen kan beroendet mellan F och agent ut- 
tryckas genom koderna 30 + 30/33, men det förutsätter att detta sägs ex- 
plicit (F är agent till E). Att förhållandet eller tillståndet existerar kan 
bara analyseras fram genom att man tar hänsyn till handlingar som F ut- 
för och som visar att de är önskade av E. För att kunna fastställa ett så- 
dant tillstånd i systemet måste man gå utanför meningsplanet ("sentential 
level"). Det är mot denna bakgrund man får betrakta de sista av Abelsons 
exempel på A-S-par. Detsamma gäller vad "Q" står för i det enskilda 
fallet. 
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De två första paren är generellt viktiga i ett system för försanthållan- 
den. De är båda impliceringar, som var och en som har förstått hand- 
lingarna håller för sant. Sådana conceptuella postulat kodar vi inte av sam- 
ma skäl som vi inte kodar Schanks implicita instrument. 

I anslutning till P- A- S-molekylen angavs ett antal alternativa meningar 
som denna molekyl kunde ha uttryckts i på ett syntaktiskt plan. Meningarna 
kodas då antingen genom att två satser relateras till varandra, såsom de 
sista exemplen lydde, eller som något av de första, där de tre satserna till 
formen är huvudsatser. Om vi här utgår ifrån att S-atomen fortfarande 
inte är relevant kunde en kodning av ett par alternativ se ut som figuren 
nedan visar. 
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Figur 8. Exempel på kodning av en enkel molekyl 

Det första vi kan konstatera i dessa två kodningar är att båda är ut- 
tryck för samma innehåll. Det första fallet är en syntaktisk mening med 
en bisats som uttrycker följd eller avsikt. Det tillstånd som finns implicit 
i bisatsen ligger i tiden efter huvudsatsens handling. Om vi översätter 
Abelsons beteckningar på denna kodning får vi molekylen A + P(S). 

Det andra består av två meningar, eftersom de är två huvudsatser. 
Den första uttrycker en Önskan med samma implicita resultat som det 
första exemplets bisats. Men i Abelsons resonemang måste en molekyl 
bestå av ett par. Vi måste alltså gå över i nästa mening (se kolumn 8) för 
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att få komplementet, som är den handling som erfordras. Vi får då mönst- 
ret P(S), A. 

Detta aktualiserar problemet med syntaktisk kodning, framför allt av- 
gränsning av mening respektive sats. En syntaktiskt fullständig mening, ut- 
gående från begreppen huvudsats och bisats,har vi ansett vara det säkraste 
sättet att koda texten i enheter. Om den formella strukturen i kodningen är 
specificerad blir det betydligt enklare att analysera relationer. Det senare 
exemplet i figuren skulle också kunna kodas i kolumn 1 8, övergripande två 
meningar. Men det blir betydligt svårare om P-A och S inte finns i omedel- 
bar närhet av varandra. Vår princip med satskolumner och looping går av 
utrymmesskäl inte att genomföra om de sammanhängande satserna blir 
fler än fem. Att gå ut över meningsplanet innebär dessutom en tolkning av 
beroendeförhållanden, vilket i så liten utsträckning som möjligt skall ske 
på det stadiet. Det är således stor skillnad mellan ett fullständigt paradigm 
och en fullständig molekyl. Paradigmet kodas enligt de regler vi anfört, 
men molekyler, dvs relationer mellan meningar är en struktur som vi av- 
ser analysera via en datorprocess. För att kunna göra det måste vi veta vad 
de olika verben har för innebörd, varvid en serie verb av ospecificerat an- 
tal kommer att höra ihop. Denna princip blir tydlig när man har insett vad 
Abel son menar med den näst högre nivån, planen. 

Abelson (1973, s 300) skriver: 

". . . if intermediate steps toward the goal are required, then the molecule 
must be larger. /. . . / Whether several necessary steps in achieving a 
purpose are obvious all along or whether they are originally unsuspected 
but låter revealed, we refer to the enlarged molecule as a 'plan'". 

Man kan exemplifiera innebörden i detta med att E, som ville ha aspirin, 
inte hade det hemma, utan först måste gå till ett apotek, som var stängt. 
Han går då till nästa apotek, osv. När han kommer hem kanske vattnet 
är avstängt, så han kan inte ta sin tablett, eftersom han aldrig har kunnat 
svälja tabletterutan vatten. Många handlingar av en eller flera personer 
kan föregå uppfyllandet av E:s uppställda mål. När målet inte kan uppfyl- 
las direkt måste en planering ske, så att kopplingen av flera handlingar 
och tillstånd till slut leder till målet. Det kan således vara ett helt nät- 
verk av "delmål". 

En plan kan vara serial eller trädlik. Den förra typen kallas för kedja, 
som enligt Abelson (1973, ss 305-306) måste uppfylla följande villkor 

a) en slutlig S-atom i kedjan är det tillstånd som förbinds med ett 
'want' i P 

b) varje A är relaterad till en efterföljande S 

c) actor i varje A är antingen actor i den initiala P eller agent för actor 
i den följande A (eller den initiala P om ingen föregående A finns) 

d) varje S "möjliggör" den A-atom som följer 
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När flera S är nödvändiga för en A kallas det träd: 



eller 





Det senare trädet representerar en plan i vilken actor utför A_ (med hjälp 
av det utanför liggande tillståndet S.) för att producera S-, som (tillsam- 
mans med de utanförliggande tillstånden S, , S«) möjliggör action A. , som 
medför resultatet S ft . 

Dessa utvidgade molekyler för diskussionen upp på en nivå, som inte 
längre berörs av kodnings reglerna i vårt system, eftersom det nu gäller 
kopplingar mellan molekyler, dvs en serie kodade meningar av skiftande 
längd. Dessutom är det inte säkert att en kedja eller ett träd återspeglas 
i den syntaktiska strukturen. Detta torde stå klart i fråga om det sista trä- 
det, där de utanförliggande S -atomerna symboliserar förutsättningar som 
kan ligga implicit i handlingars utförande. Så kan t ex förutsättningen för 
att en forskare i vår intervju använaer sig av ett visst informations organ 
vara att han vet hur han skall använda det ; att han har gjort en sökprofil 
för sökning i ERIC- systemet, osv. Om sådana uppgifter fin^j, kodas de 
självfallet, men i annat fall kodar vi bara uppgiften om att han använder 
det eller det organet. 

Kärnan i en plan är verben, som för handlingen framåt mot ett mål 

(i bästa fall). Den information som en person ger om ett händelseförlopp 

är den som han själv anser vara nödvändig för att lyssnaren skall uppfatta 

förloppet. Abelson (1973, s 310) skriver; 

"The . . . verbs refer to the actions. . . , the heart (or should one say spine?) 
of the plan. The rest of the structure has to do with the enabling know- 
ledges and accesses, the littie things which must be true for the plan to 
succeed, but which are often left implicit in informal discussion. " 

Detta resonemang är alltså av samma slag som Schanks. "The littie things" 
hänför sig till de conceptueila reglerna, som en kognitiv struktur består av. 
För att få en uppfattning om i vilken utsträckning en plan är skönjbar på 
den syntaktiska nivån har vi gjort en sökning i vårt material, där vi speci- 
ficerade följande: Skriv ut samtliga meningar som har kod (1 , 2) i kolumn 
18. Som redan visats innebär denna kodning att vi får uppgifter om en 
önskan eller avsikt tillsammans med en handling som är relaterad till må- 
let. Vi skall nedan exemplifiera utskrift från en ip. (Frågan gäller infor- 
mation och hur den eventuellt kan förbättras. ) Den första meningen har 
nr 35 och den sista nr 41, som var de två som återvanns: 
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35. "Det är naturligtvis bra att få så mycket som möjligt av översikterna 
gjorda så att man vet vad man själv ska läsa. " 

41. "Det finns inte en person som skulle kunna täcka alla områden så bra 
att han kan klara av att göra en god sammanfattning. " 

Det är otillfredsställande att inte känna till vad som hänt emellan dessa två 

meningar, att inte veta vilken strategi-som företagits för att komma fram 

till vad den sista meningen uttrycker. Detta granskades och mellanliggande 

meningar kompletterades. Vi har försökt ange dem enligt symbolerna för 

en plan, som ruta 1 3 nedan visar. 

Ruta 13. Sökning i ANACONDA-materialet: Meningar enligt en plan 



Men nr 


Text 


Symbol 


35 


Det är naturligtvis bra att få så mycket som möjligt 
av översikterna gjorda så att man vet vad man själv 
skall läsa. 


A + P 


36 


Man måste komma till en annan värdering av forska- 
ren 


P 


37 


Jag är uppfostrad i den traditionen att referera 


S 


38 


Att ha referens i texten som man inte har läst är ju 
mycket ofint 


S 


39 


Det finns ingen chans för forskaren att sitta och läsa 
primärmaterialet 


S 


40 


utan han skall mycket väl lita på vad andra har gjort 


A 


41 


Det finns inte en person som skulle kunna täcka a. la 
områden så bra att han kan klara av att göra en god 
sammanfattning 


S + P 



Utgående från den första meningen kan vi säga att forskaren ifråga (Ego) 
önskar att han fick veta vad det är som just han ska läsa för att ha den 
bästa tänkbara informationen om sitt eget område. Det slutliga tillståndet 
skulle då vara att han har tillgång till det han önskar. Den sista meningen 
anger dock att han inte uppnått det målet. 

Vad ip här gör är inte att tala om hur han har kommit till målet, utan 
varför han tycker som han gör, vilket uttrycks i form av förutsättningar i 
hans egen tankevärld. Om man skulle uttrycka detta i Abelsons symbol- 
språk kunde det kanske se ut som i figur 9. 
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Figur 9. Representation av en plan 

Figuren skall tydas på följande sätt: 

Kedjan inom Sy innefattar Egos erfar enhets värld. Värderingen av forska- 
ren (P ? ) skall vara en tilltro (S-). Förutsättningarna ligger inom Ego själv 
(S ? , S,, S>). Eftersom detta är Egos kognitiva struktur, finns det ingen 
A -atom för handling och kedjan är ingen fullständigt egen plan, så vi har 
markerat den som tillhörig S, genom klämmer. 

Strukturen i S, medför att P kommer till uttryck. En hämmsko för 
Aj är dock S,, som inbegriper ett P-S-par som uttrycker att A inte kan 
genomföras på det sätt Ego skulle vilja, och därför når vi inte fram till 

1 hand < 



'0' 



■■g'- 



l gon (agent?) 



problemet. 



det inget som Ego själv kan göra? Vi var intresserade av det och gick till 
materialet för att studera meningarna efter nr 41. Den information vi där 
fick ser ut så här i symbolform: 
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Ego läser sa- 
ker och ting 




Lösning av infor- 
mationsproblem 



Ego utför sa' 
ker och ting 



Informationen är 
tillfredsställande 



Han säger nämligen så här i fortsättningen: 

"Det finns ju en annan lösning på informationsproblemet. Och det är ju helt 
enkelt att inse att antingen får jag ägna mig åt att läsa saker och ting eller 
också får jag ägna mig åt att göra saker och ting. Man kan inte göra båda 
delarna. " 

Ego har alltså två tänkbara strategier. Vilken han i realiteten ägnar sig åt 
framgår fortfarande inte. "Vi kan här avsluta diskussionen genom att försik- 
tigtvis konstatera att situationen för Ego är frustrerande. 

Här har tagits upp ett besvärligt exempel på den nivå Abelson kallar 
plan. Det har medvetet valts för att konkretisera skillnaden mellan vad vi 
kan koda på ett syntaktiskt plan och vad som därmed går förlorat. Språk- 
struktur och tankestruktur går inte alltid hand i hand och det är den insik- 
ten som har varit avgörande för vad våra kodningsregler kan hjälpa till med 
och på vilken nivå vi sedan måste ha datorn till hjälp. 

Den nivå Abelson (1973, s 315) kallar tema är en utvidgning av en plan, 

på så sätt att den involverar en annan actor. Han förklarar: 

". . . beliefs about social reality must include themes of cooperative and 
competitive interpersonal relation ships. /. . . / ... interdependence arises 
as a function of role in the other's plan, of attitude toward the purpose or 
activities of the other, and of ability to facilitate or interfere with the out- 
comes of the other. The conjunctions of these three variables gives each 
theme its particular character, " 

En actor kan vara målet för en handling av en annan actor, t ex så att hand- 
lingen är positivt eller negativt riktad mot en actor. Men en actor behöver 
inte vara direkt involverad utan endast som s k intressent. Dessutom har 
vi redan nämnt det förhållandet när en actor är agent till en annan. De 
känslor som olika actors har för varandra styr deras reaktioner, som kan 
vara handlingar eller kommentarer. De handlingar som olika actors utför 
med kännedom och åsikter om varandra kan utföras parallellt eller i ett 
beroendeförhållande, där den ena handlar åt den andra som agent. Agen- 
tens känslor för en actor bör i övervägande grad vara positiva, i annat fall 
blir han sin egen actor och tar egna initiativ som avviker mer eller mindre 
från den förras. På detta sätt resonerar Abelson sig fram till hur actors 
känslor för varandra kan pendla mellan kärlek och hat. Dessa och käns- 
lor däremellan, t ex "devotion", "admiration" är teman. För att kunna 
bygga upp en tematisk struktur måste man känna till vilka actor och agent 
är och vilka känslor som finns. Annars kan man inte bedöma en enskild 
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händelse. Men med denna kännedom är det möjligt att gruppera vilka actors 
som har samma belief system , vilka som är oberoende och beroende, 
vilka som koopererar, etc. Teman är alltså interaktioner mellan individer, 
organisationer eller nationer. Abelson (1973, s 325} utvidgar detta resone- 
mang : 

"Themes capture what one might call 'temporary dynamics', relationships 
which last only as long as the durations of the respective plans, After the 
completion of the realization of a therne, a further realization of the same 
theme is possible only when the relationship between the actors remains 
the same. " 

När relationerna mellan actors ändras bildas nya teman. Ju längre utdra- 
get händelseförloppet är i tiden, desto fler teman kan uppstå, s k temasek- 
venser eller scripts. Karakteristiskt för olika belief systems är oftast va- 
riationen av scripts. Vi skall ta ett exempel från Abelson (1973, s 320) för 
att klargöra skillnaden mellan tema och script. 

Ett av de tolv olika teman som anges kallas dominans, som ju uttryc- 
ker beroendeförhållanden. Detta tema är det åttonde (T R ). Vi kan exempli- 
fiera temaförändringarna i händelseförloppet (scriptet) revolution: 

T g (E; F) >T q (E; F) »T^ (E; F) > T ? (E; F) »T g (F; E) 



Beteckningarna inom klämmer är de tidigare kända symbolerna Actor (E) 
och Agent (F). Detta skript uttyds på följande sätt: 

Utgångspunkten är att E dominerar F. Sedan inträder händelser, där 
rebelliska tendenser blommar \ipp (T q ), vilket leder till konflikt (T,-)- T_ 
säger att konflikten, leder till seger för den underlydande och detta nya be- 
roendeförhållande märks i F och E:s förändrade roll ifråga om dominans. 

Abelsons nivåer representerar en hierarki, där teman och scripts be- 
finner sig högst upp på pyramiden. För att strukturer på dei nivån skall 
bli analyserbara måste först de föregående nivåerna ha urskilts. På de 
mer eller mindre konkreta nivåerna har vi kunnat göra en jämförelse med 
vårt sätt att representera strukturerna. 

Abelson går inte in på hur hans system opererar genom de konkreta 
nivåerna för att resultera i en innehållsstruktur på de abstrakta, varför 
en jämförelse inte är möjlig. Den rekvisita som är nödvändig för att nå 
upp till de abstrakta strukturerna tycks dock i vårt fall finnas. Tematiska 
strukturer bygger på värderingar, vilket även för oss är grundläggande. 
Genom skalering av adjektiv och verb bestäms innehållet i de begrepp 
som bildar basstrukturen. En viktning av substantiv kommer att ske och 
denna procedur, som närmast skall rapporteras av B. Bierschenk, 
är inte genomförd i sin helhet. Så länge vi inte har innehållsbestämt våra 
grundenheter kan vi inte diskutera de olika temans relevans för vår ana- 




66 



lys och inte heller vilka kopplingar mellan eller inom nivåerna vi skulle 
behöva göra för att finna tematiska variationer. Detta medför att även 
scripts lämnas utanför i det här sammanhanget. Varken teman eller 
scripts kan tillföra våra kodningsregler något nytt. Frågan är om de över- 
huvudtaget är tillämpliga i vår analys. Relevansen är beroende av det 
innehåll vi vill nå fram till. Abelson (1973, s 334) definierar "innehåll" i 
sitt fall som: 

"/an/ . . . important source of variation between belief systems is in the 
assignment of parti cular actors or categories of actors to particular atoms, 
plans, themes, and scripts. This is essentially what we mean when we. re- 
fer to content . " 

Eftersom Abelsons syfte är att studera interaktioner mellan system, är 
det tveksamt hur långt vi kan gå. Den kunskap och värderings struktur som 
vårt material innehåller gäller inom ett system. Genom våra ip utsagor om 
olika actors kan vi få fram variationer i bedömningen av actors. Men det 
betyder inte att vi har definierat vilka personer som är actors och vilka 
som är agenter enligt Abelsons teori. (Jfr även fig 7.) Skillnaden mellan 
actor och agent är tämligen konkret inom ett politiskt system eller mellan 
system, men hur är det bland svenska forskare i pedagogik och psykologi? 
Är SÖ actor och forskare agenter i vissa fall? Det är onekligen en spän- 
nande frågeställning, men vi låter den tills vidare stå öppen. 
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7. SAMMANFATTNING 

Denna rapport har redovisat ett försök med datorbaserad innehållsanalys, 
kallat ANACONDA (Ana lysis of concepts byjiata processing), som ingår 
som en metodstudie inom projektet Skolpedagogiska sökstrategier vid lä- 
rarhögskolan i Malmö. 

Först har vår metod satts i ett internationellt sammanhang, på så sätt 
att den jämförts med internationella konventioner ifråga om behandlingen av 
text för vidare datoranalyser. I samband därmed redogjordes för de prin- 
ciper enligt vilka vi ämnar bygga upp begreppsregister, som skall bilda 
basen för vår analys (kap 2-4). 

Därefter sattes vårt system i relation till en teori om språk- och tanke- 
strukturer. Vi har visat pä vilket sätt den modell, som innehåller en sym- 
bolisk representation av begrepp och relationer, och vars teoretiska anta- 
ganden vi ansluter oss till, är möjlig att omsätta till ett system av sekven- 
tiella si fferkombina tioner (kap 5). 

Till sist anknöt vi till en teori om "belief systems", där vi kunde för- 
ankra våra kodningsregler i praktiken, dvs där våra kodningsregler kunde 
tillämpas i en hierarkisk struktur. I detta avsnitt försökte vi komma fram 
till på vilken hierarkisk nivå i systemet våra kodningsregler är till hjälp 
vid analys av tankestrukturer och i vad mån andra nivåer i detta system är 
relevanta för oss (kap 6). 

En summering av de ovan nämnda jämförelserna görs nedan. Avsikten 
med denna relativt utförliga sammanfattning är att ge läsaren möjlighet att 
informera sig om innehållet i rapporten utan att behöva studera varje ka- 
pitel ingående. Den som är intresserad av de mera tekniska aspekterna 
rekommenderas dock att följa jämförelsen kapitel för kapitel. 



7. 1 Konventionell behandling av text och uppbyggnad av lexikonbas 

En innehållsanalys baseras alltid på ett lexikon, men förutsättningarna för 
detta kan variera. Vi har jämfört vår analys med General Inquirer (GI), 
som är ett av de mest kända textanalys systemen inom samhällsvetenska- 
pen. (Se t ex Stone et al. , 1966.) Denna jämförelse, har gett oss följande 
väsentliga skillnader att redovisa. 

Texterna som behandlas i GI- systemet är vanligen skrivna dokument, 
medan vi har talspråkstext, vilket medför att vi måste 'tillgripa särskild 
rensning av texten innan vi kan koda den. 

Analysenheten i GI är det enskilda ordet och man stansar in hela me- 
ningar utan segmentering. Vår analysenhet är meningen "sentence 11 , där 
delarna inte är ord utan begrepp, som kan bestå av flera ord. Genom att 
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vi kodar meningar kan vi också koda det övergripande temat, vilket GI inte 
gör. 

GI redovisar problem med idiom, vilket för oss inte innebär problem, 
eftersom dessa kodas som ett begrepp, oavsett hur många ord det innehål- 
ler. 

Användare av GI får ingen syntaktisk information. Vi kodar denna i 
form av AaO- relationer. 

En internationell konferens om datorbaserad innehållsanalys inom 
samhällsvetenskapen, som hölls i Pisa 1 974,har kommit fram till att en 
standardisering måste ske ifråga om bl a inmatning och identifikation av 
items. Innan denna konferens hölls hade vi utarbetat principerna för vår 
input. Vi har kunnat konstatera att vi följer dessa s k Pisa -konvention er, 
vilket är viktigt om vi vill presentera vårt system internationellt. 

Pis a-konferens en mynnade också ut i några rekommendationer för 
forskare och systemutvecklare när det gäller lexikonbasen. GI har pro- 
blem med att särskilja typ av ord och fall av samma ord. Ett ord (i vårt 
fall begrepp) i lexikon skall kategoriseras genom deskriptorer, som sär- 
skiljer det från andra ord (begrepp). De problem som diskuteras gäller 
särskilt sammansättningar och suffixbildningar, där inte alla språk är upp- 
byggda som engelskan, vilket GI grundar sig på. Vi har visat att det är 
möjligt att bygga upp lexikon på svensk bas och hävdar att det är nödvändigt 
för varje språk att utbilda sina egna regler för registrering av items i 
lexikon. Vi använder bl a ett trunkeringsförfarande, som medger en stor 
flexibilitet när det gäller att återvinna begrepp, sammansatta eller enkla. 
Jämfört med GI tycks vårt sätt att arbeta med begrepp i stället för ord be- 
tydligt förenkla denna registreringsprocedur. 

Vi har betonat att begreppen i vår analys i motsats till GI är kontext - 
bundna och denna bundenhet framträder redan på kodnings stadiet (AaO- 
paradigmet). Vi avser inte utveckla program där datorn skall "förstå" 
texten. Det innebär att vår kodning av text är en tidsödande procedur, men 
i gengäld ger den större möjlighet än GI att snabbt ge oss svar på frågor, 
vilket GI inte har möjlighet till. T ex har vi redan på kodnings stadiet diffe- 
rentierat mellan olika typer av meningar. Att få fram sådana differenser i 
efterhand är ett omfattande programmeringsarbete. 

Sammanfattningsvis kan sägas att de problemområden som presente- 
rats till konferensen i Pisa i hög grad faller inom disciplinen sociologi, 
vilket kan förklara det ringa intresset för språkstruktur eller psykologiska 
teorier. Dessa förankringar hos oss har medfört det relativt stora avstån- 
det från de Gl-baserade textanalyserna. 
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7. 2 Kodningsregler enligt en teori om tankestrukturer 

Vi ansluter oss till Schanks (1973) teori om "conceptual dependencies". En- 
ligt den rör sig språkanalys på två nivåer, en meningsnivå ("sentential level") 
och en begreppsnivå ("conceptual level"). Det finns egentligen bara två slag 
av begrepp, nämligen beroerde och oberoende. Detta förhållande har vi ut- 
tryckt i vårt kodningssystem genom tvåsiffriga koder. 

Schank presenterar 14 grundregler som gäller de båda nivåerna. Dessa 
regler har jämförts med ANACONDA -kodningen, där vi kommit fram till 
följande resultat. 

Vi har i vår framställning urskilt flera slag av beroenden, dels ett ver- 
tikalt, dvs mellan beroende och oberoende begrepp, dels mellan begrepp på 
ett syntaktiskt horisontellt plan. Vi diskuterar också beroende och oberoen- 
de relationer, dvs satsers förhållande till varandra. Det första slaget av 
beroende avser Schanks regler 1-5. Oberoende begrepp är »sådana, som 
är huvudord i ett komplex, bestående av t ex attributiva bestämningar till 
detta begrepp. Huvudbegreppet har en kodsiffra som slutar på 0, medan be- 
roende begrepps slutsiffra är 1 , 2 eller 3, Reglerna 1-5 är representerade 
i vårt kodnings system utan inskränkningar. 

Reglerna 6-9 gäller s k conceptuella kasus och avser ett horisontellt 
beroende, såtillvida att man med utgångspunkt i verbets betydelse specifi- 
cerar hur många oberoende begrepp som måste finnas på meningsnivån. 
Dessa kasusförhållanden framträder även hos oss, men vi har hittills inte 
benämnt koderna enligt kasus. De fyra kasus är "objective", "recipient", 
"instrumental" och "directive". De motsvaras hos oss av respektive ob- 
jekt (direkt), objekt (indirekt, eller mål), sättsadverbial och rumsadver- 
bial. Det enda fall där vi kan säga att vår kodning egentligen skiljer sig 
från ka sus distinktion er är i fallet ''directive. 1 Vi har nämligen inte ännu 
skilt på riktning och befintlighet i denna kod. 

Angående beroendets uttryck i kodsiffrorna kan sägas att kasus är 
oberoende begrepp (substantiv) som i sin interna beroende struktur inte 
skiljer sig åt. Därför borde de inte ha en beroendesiffra, som ansluts till 
verbet (andra kodsiffran). Eftersom vi inte från början utgått från kasus- 
teori ("conceptual cases") har vi dock i två fall uttryckt ett sådant beroen- 
de, nämligen i adverbialen. Där har vi tagit hänsyn till det traditionella 
sättet att analysera satser och dessa adverbialbegrepp är lätta att känna 
igen vid kodningen. Det är således en praktisk åtgärd och har inget med 
avvikelse från Schanks teori att göra. Men vi kommer förmodligen att 
ändra våra koder så att de på ett bättre sätt ansluter till teorin, särskilt 
i fallet "directive". 
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Teorin om nödvändiga delar tar vi även hänsyn till på annat sätt. Efter- 
som språk är ekonomiskt i förhållande till tankar bakom yttranden, finns 
inte alla nödvändiga delar med i en talare-lyssnare- situation. Den nödvän- 
diga begreppsapparaten finns hos lyssnaren och en syntaktiskt ofullständig 
mening blir ändå förstådd. Men denna förståelse har inte datorn, så därför 
supplerar vi in de delar som saknas. Det gäller för oss att koda fullstän- 
diga komplex och fullständiga AaO-paradigm. Paradigmet innebär agent, 
verb och objekt (ett eller två). När så verbet i stället för objekt har plats 
som mål suppleras detta begrepp in. I paradigmet ingår däremot inte in- 
strument som nödvändigt, om det inte finns explicit. En väsentlig skillnad 
mellan Schanks teori och vår praktiska kodning i anslutning till den gäller 
hur långt vi skall gå i representation av conceptuella regler (tankestruktu- 
rer). Hos Schank är kasus "instrument" en nödvändig del inom verbets be- 
tydelse, så att t ex verbet 'äta' måste betyda ungefär 'med bestick' som in- 
strument. Som ovan sagts kodar vi inga instrument som inte nämnts i tex- 
ten. På samma sätt blir även rumsadverbial utanför paradigmet och kodas 
inte, även om man måste förutsätta att en handling ägde rum någonstans. 
Men Schank säger också själv att det finns vissa begrepp som är så kända 
av lyssnaren (t ex 'äta') att det är ointressant att specificera instrumentet. 
Vi tänker inte på det medvetet. 

Schanks regler 11 (a, b) - 14 gäller vad han kallar relationer, dvs sat- 
sers förhållande till varandra inom en mening. Vi har kunnat visa att, även 
om hans modell i form av diagram är symboliskt komplicerad , vi har möj- 
lighet att uttrycka relationer genom vårt siffersystem i kombination med 
övergripande kodning av ett s k satstema. 

Även här avspeglas en skillnad i sättet att representera verbet. Schank 
symboliserar explicit det resultat som ligger i vissa verb, t ex 'döda', 
som han kallar pseudo-state-verbs. Vi stannar vid att koda verbet och an- 
ger inte ett eventuellt resultat. Det medför att regel 11b för oss inte är 
relevant. 

Relationer framträder genom en satsinledare. Dessutom kodas sats- 
beroende med koder för orsak, avsikt, osv. Ett loop- system gör det möj- 
ligt att urskilja huvudsats och bisats eller vilken av satserna som kommer 
tidsmässigt före den andra, Det är detta som Schank kallar kausalitet. Det 
finns även andra conceptuella relationer, nämligen tids- och platsrelatio- 
ner. Tid som ett enda begrepp eller som bestämning i form av bisats ses 
som modifierare till en hel sats och det finns alltså ingen kausalitet. Det 
mest praktiska sättet att ange modifiering till en hel sats har vi tyckt vara 
att ge dessa begrepp en beroendekod till verbet, eftersom det är verbet 
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som är det vä sen t'-" ga i satsen. Att ingen kausalitet finns anges genom att 
satsen inte får sats temakod, som de övriga, Reglerna 12-14 återspeglas 
alltså hos oss. 

Sammanfattningsvis kan vi anföra följande. Den teori som Schank pre- 
senterar och som vi ansluter oss till har fått sitt uttryck i den kodning av 
text som har utvecklats inom ANA CO NDA- sys temet. En tveksam punkt 
finns dock, nämligen i vad mån det är nödvändigt att explicit ansluta sig till 
ka sus -begreppen. Möjligen vore det av värde att se över adverbialkoderna 
och splittra dessa på samma sätt som de övriga koder som innehåller sub- 
stantiv, dvs oberoende begrepp. 

7. 3 Kodningsreglers tillämpning i en hie rarkisk struktur 

En kodning av en text enligt en språkteori behöver ofta modifieras i enlig- 
het med en teori om den "värld" som dessa data är en representation av. 
En sådan modifiering av Schanks teori har vi funnit hos Abelson (1973) i 
ett arbete om "belief systems", vilket därför har diskuterats i jämförande 
syfte. 

Det för vår del väsentliga ställningstagandet hos Abel son är att han är 
mer orienterad mot relationer mellan beroenden än inom beroenden. Detta 
får bl a till följd att han inte intresserar sig för verbs implicita resultat 
utan den aktivitet som verbet uttrycker genom riktningen i handlingen. Där 
har vi således samma utgångspunkter. 

En annan punkt på begreppsplanet, där vi får stöd av Abelson är att 
han i första hand arbetar med huvudbegrepp. Bestämningar av olika slag 
är inte nödvändiga delar. Det är när bestämning finns utan huvudord som 
supplering sker hos oss och inte tvärtom. 

Abelson utgår ifrån att det finns sex nivåer i ett belief system, näm- 
ligen element, atomer, molekyler, planer, teman och scripts. Element 
motsvaras av våra begrepp, atomer av satser. Molekyler är länkar av 
satser som förs ihop, om satsernas verb uttrycker tanke (syfte), handling 
eller tillstånd. Kedjor eller nätverk av sådana molekyler bildar en plan, 
som innefattar syfte (avsikt eller mål), handlingar eller tillstånd som di- 
rekt eller sidoordnade för till målet, samt det slutliga tillstånd som varit 
syftet. Dessa nivåer kan betecknas som konkreta och har kunnat jämföras 
med våra kodningsregler och deras kapacitet ifråga om återvinning. De 
övriga två nivåerna, de abstrakta, innebär strukturer i värderingar och 
attityder hos personer, organisationer och nationer och har inte kunnat 
ge våra kodnings regler något tillskott. Dessa nivåer kan endast diskute- 
ras när en innehålisbestämning har gjorts av våra begrepp. I vad mån 
dessa översta nivåer i hierarkin är applicerbara på vårt material och re- 
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levanta för det belief system vi analyserar har ifrågasatts, främst med 
tanke på att vi rör u3S inom ett system och inte mellan system. 

Det väsentliga i diskussionen om de fyra konkreta nivåerna är än en 
gång att påpeka att vår största analysenhet är den syntaktiska meningen. 
För oss kan således varje typ av atom vara en mening, antingen den ut- 
trycker tanke, handling eller tillstånd, Ett tillstånd uttrycks via vår kod- 
ning genom att verbet 'vara' m fl särskiljs med annan kod från övriga verb. 
Utan att ytterligare kategorisera verben vid kodningen kan vi visa att vi 
kan återvinna sådana fullständiga molekyler som Abelson antar. 

En speciell distinktion gör Abelson, nämligen den mellan" a ctor" och 
"agent". Det tycks särskilt lämpligt i det politiska spel han diskuterar uti- 
från. Actor är överordnad agent och den senare ses som beroende. Vi har 
inte utan vidare kunnat anta den distinktionen, eftersom vår analys inte har 
till syfte att spegla sådana beroenden mellan personer. Men vi har kunnat 
visa att det går att på ett syntaktiskt plan komma fram till den genom hu- 
vudsats- och bisats -tekniken, förutsatt att detta beroende är explicit på 
den syntaktiska nivån. 

Det har varit särskilt väsentligt att framhålla våra sats-tema-koders 
betydelse för en analys av strukturer på olika nivåer. Genom att vi speci- 
ficerar en sökning i materialet till att gälla meningar med kod för t ex av- 
sikt, kan vi återvinna vad Abelson menar med^purpose;' Vi kan sedan fort- 
sätta bakåt eller framåt och få fram handlingar och tillstånd, så att vi 
kommer fram till nivån plan . Planer är utvidgade molekyler, dvs en se- 
rie kodade meningar av varierande längd. Våra kodningsregler sträcker 
sig fram till molekyl -plan et. En sökning med hjälp av satstema -koder för 
oss fram ytterligare ett steg, men därefter tar de abstrakta nivåerna vid. 

Sammanfattningsvis kan sägas följande, Den teori om belief systems 
som Abelson presenterar har som grund Schanks be grepps struktur er. 
Abelson går ett steg ytterligare genom sin analys av beroenden mellan 
relationer. Vår grund är densamma och omfattar även de inskränkningar 
av Schanks modell som Abelson gör. Därutöver har vi kodnings regler 
som täcker beroenden över meningsplanet upp till en struktur av den nivå 
som kallas plan. För att systematiskt kunna återvinna planer bör vi emel- 
lertid se över verben, på så sätt att vi bestämmer vilka som innebär till- 
stånd (t ex även verbet 'ha'). Detta kan bli möjligt genom resultatet av 
den skaleringsprocedur som genomförts och som skall redovisas inom 
kort. 
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9. BILAGA 



9. 1 Termförklaringar 



Bil 1:1 



9. 1 Ter mf örklar ingår 



final bisats 
idiom 



uttrycker en avsikt av typen 



för att 



kasus 



kausal bisats 
koncessiv bisats 



konditional bi sat s 
kons ekutiv bisats 
kontext 



kontextbunden 
kontextfri 




kopula 



modal , modalitet 
modus 



är uttryck som består av flera ord, som tagna var för 
sig inte betyder detsamma som inom flerordsgruppen. 
Man brukar säga att idiom är stelnade uttryck, vilket 
bl a innebär att ett substantiv som ingår i uttrycket 
inte ändrar form i vilket sammanhang det än förekom- 
mer: 'bära hand på', 'hålla hus'. Förutom dessa ut- 
tryck finns andra vanliga flerordsuttryck. som t ex 
'i dag', 'för alltid', som också räknas till de idioma- 
ti ska , 

fall, verklig eller möjlig eller tänkt händelse eller om- 
ständighet; 

benämning på böjningsform som anger ett nomens (sub- 
stantiv) eller pronomens förhållande till annat ord el- 
ler ordgrupp i satsen. Kasus bestäms genom verbets 
betydelse. Vissa verb "fordrar" fler kasus än andra. 
Det kasus (eller fall) ett nomen får i en viss sats kan 
ibland anges genom prepositioner i svenskan (såsom 
åt, för, etc). Kasus-böjning i t ex ackusativ och dativ 
finns i tyskan, 

uttrycker en orsak av typen 'Eftersom . . . ', 'Av att 

uttrycker ett medgivande av typen 'Trots att . . . , 
'Även om . . . ' 

uttrycker ett villkor av typen 'Om . . . , (så)' 

uttrycker en följd av typen ' . . . , så att 

sammanhang (vari ett ord eller uttryck ingår), omgi- 
vande text 

med hänsyn tagen till omgivande text 
utan hänsyn tagen till omgivande text 

förbindelseled, verbform som förbinder subjekt och 
predikat i en sats. Det vanligaste kopulaverbet är 
'vara' ('är'), dessutom 'bliva', 'heta', 'kallas' m fl 
liknande. 

(se modus ) 

det sätt på vilket något framträder som varande eller 
handlande; 

farmkategori som anger den talandes (eller skrivandes) 
uppfattning av det utsagda. Indikativ, konjunktiv och 
imperativ är modus. Indikativ uttrycker något som 
faktiskt sker. Imperativ uttrycker uppmaning. Kon- 
junktiv uttrycker inget faktiskt skeende, utan den ta- 
landes (eller skrivandes) önskan, etc. 

När vi talar om modalitet , menar vi vanligen den be- 
tydelse som ligger i konjunktivens funktion, även om 
konjunktiv som verbform sällan förekommer numera 
i svenskan. Modalitet kan uttryckas förutom genom 
verbformen också genom modifierande adverb (kanske, 
möjligen, etc) eller genom modala hjälpverb (vill, bör, 
måste, etc). 



morfologisk 



predika tiv 



semanti sk 
syntaktisk 
syntax 



tempus 



Bil 1:2 

av 'morfologi' som betyder formlära. 

Den minsta betydelsebärande enheten kallas morfem . 
Morfemen kan vara lexikaliska( lexem)eller gr amma - 
tiska (ändelse r, prefix, suffix). 

det satsled som följer efter ett kopulaverb; i traditio- 
nell satsanalys även kallat pr edikatsfyllnad, 
Predikativa påståenden är sådana påståendesatser (dvs 
som inte uttrycker fråga, uppmaning eller liknande) 
som konstrueras med kopulaverb som länk mellan sub- 
jektet och övriga satsled, 

av 'semantik' som betyder betydelselära, 

(se syntax ) 

satslära, del av grammatiken som behandlar ordens 
förbindelser till högre enheter. Syntaktiska regler sä- 
ger t ex i vilken ordning morfem binds ihop till ord, 
ord till fraser och fraser till satser och meningar. Om 
enheterna inte följer en viss ordning (struktur) är en 
sats inte syntaktiskt korrekt. 

tidsform hos verb. Presens, futurum, etc är tempus- 
beteckningar. Verb har en tidsaspekt och en modus- 
aspekt (se modus }, 
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Abstract card 



Reference card 



Bierschenk, I. Datorbaserad innehållsanalys: Teoretiska och 

praktiska överväganden. /Computer-ba sed content analysis: 
Theoretical and practical considerations. / Pedagogisk- 
psykologiska problem (Malmö, Sweden: School of Education), 
Nr 283, 1975. 

This report describes a Swedish contribution to computer- 
based content analysis research. The method is compared to 
international conventions regarding the treatment of text for 
computer-ba sed analysis. An account is given of how a dic- 
tionary can be built up on the basis of the Swedish language. 
The coding of the text is based on a theory about thought 
structures and the report describes the way in which this 
theory can be converted into a system for coding concepts 
and relations. The system of rules is then put in relation to 
a theory about the simulation of cognitive and emotional 
structures. The capacity ef the system of rules for analysis 
on different hierarchical levels is presented. 
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